Por: Julia Torrez
Este proyecto se enfocará en realizar un análisis de evaluación sumativa para estudiantes de telecomunicaciones. Vamos a utilizar Python y las bibliotecas pandas, matplotlib, y seaborn para realizar el análisis de datos. Asumiremos que estamos trabajando con un conjunto de datos ficticios que representa el rendimiento de los estudiantes en diferentes áreas de estudio.
Paso 1: Definición de Variables y Generación de Datos
import pandas as pd
import numpy as np
import random
# Definir el número de estudiantes y variables
num_estudiantes = 100
# Crear datos ficticios para cada estudiante
data = {
'ID_Estudiante': range(1, num_estudiantes + 1),
'Nombre': [f'Estudiante_{i}' for i in range(1, num_estudiantes + 1)],
'Calificacion_Matematicas': np.random.uniform(60, 100, num_estudiantes),
'Calificacion_Fisica': np.random.uniform(60, 100, num_estudiantes),
'Calificacion_Tecnologia': np.random.uniform(60, 100, num_estudiantes),
'Calificacion_Comunicaciones': np.random.uniform(60, 100, num_estudiantes)
}
df_telecom = pd.DataFrame(data)
df_telecom.to_csv('evaluacion_telecom.csv', index=False)
En este código, hemos creado datos ficticios que representan las calificaciones de estudiantes de telecomunicaciones en diferentes áreas de estudio.
Paso 2: Análisis Exploratorio de Datos (EDA)
# Cargar datos desde el archivo CSV
df_telecom = pd.read_csv('evaluacion_telecom.csv')
# Mostrar las primeras filas del DataFrame
print(df_telecom.head())
# Estadísticas descriptivas
print("\nEstadísticas Descriptivas:")
print(df_telecom.describe())
# Visualizar la distribución de calificaciones en Matemáticas
import seaborn as sns
import matplotlib.pyplot as plt
plt.figure(figsize=(10, 6))
sns.histplot(df_telecom['Calificacion_Matematicas'], bins=20, kde=True)
plt.title('Distribución de Calificaciones en Matemáticas')
plt.xlabel('Calificación')
plt.ylabel('Frecuencia')
plt.show()
RESULTADO:
ID_Estudiante Nombre Calificacion_Matematicas Calificacion_Fisica \
0 1 Estudiante_1 83.636644 77.531944
1 2 Estudiante_2 99.568667 70.507732
2 3 Estudiante_3 66.673188 66.588710
3 4 Estudiante_4 61.867393 87.565734
4 5 Estudiante_5 91.181267 80.582845
Calificacion_Tecnologia Calificacion_Comunicaciones
0 89.438142 62.689625
1 72.049252 78.587579
2 78.535640 92.829434
3 83.977222 84.581641
4 66.850936 93.286498
Estadísticas Descriptivas:
ID_Estudiante Calificacion_Matematicas Calificacion_Fisica \
count 100.000000 100.000000 100.000000
mean 50.500000 80.280443 80.069208
std 29.011492 11.623540 11.797120
min 1.000000 60.051377 60.031580
25% 25.750000 70.030373 70.070555
50% 50.500000 81.008930 81.345096
75% 75.250000 89.054173 89.987363
max 100.000000 99.896918 99.867331
Calificacion_Tecnologia Calificacion_Comunicaciones
count 100.000000 100.000000
mean 78.198287 78.109087
std 11.291524 11.367528
min 60.028674 60.093899
25% 69.128451 68.282728
50% 77.084879 77.253058
75% 87.843574 87.397398
max 99.453997 99.683687
En este paso, realizamos un análisis exploratorio de datos básico. Cargamos los datos, mostramos las primeras filas, estadísticas descriptivas y visualizamos la distribución de calificaciones en Matemáticas.
Paso 3: Visualización Multivariable
# Visualizar la relación entre las calificaciones en Física y Tecnología
sns.pairplot(df_telecom[['Calificacion_Fisica', 'Calificacion_Tecnologia']])
plt.suptitle('Relación entre Calificaciones en Física y Tecnología', y=1.02)
plt.show()

Aquí, utilizamos un gráfico de pares para explorar la relación entre las calificaciones en Física y Tecnología.
Conclusiones:
Generación de Datos Ficticios: La creación de datos ficticios nos permite simular el rendimiento de los estudiantes y realizar análisis sin depender de conjuntos de datos reales.
Análisis Exploratorio de Datos: El EDA nos ha proporcionado información clave sobre la distribución de calificaciones y la relación entre diferentes áreas de estudio.
Visualización de Datos: Las visualizaciones, como histogramas y gráficos de pares, son herramientas útiles para entender la variabilidad y relaciones en los datos.
Aplicación en Telecomunicaciones: Este proyecto puede aplicarse para evaluar el rendimiento de estudiantes de telecomunicaciones en áreas específicas y proporcionar información valiosa para mejorar el proceso educativo.
Este proyecto es un ejemplo básico de análisis de evaluación sumativa para estudiantes de telecomunicaciones. Puedes personalizar y expandir este proyecto según tus necesidades específicas y la complejidad de tus datos. Recuerda que los datos utilizados son ficticios y con fines educativos. En un entorno real, trabajarías con datos reales y adaptarías tu análisis en consecuencia.
No hay comentarios:
Publicar un comentario