Julia Torrez Soria - Python en 10 minutos

domingo, 10 de diciembre de 2023

La importancia de la Evaluación sumativa en Ciberseguridad

Por: Julia Torrez

1. Definición del Problema

En este proyecto, realizaremos un análisis de la evaluación sumativa en el ámbito de la ciberseguridad. El objetivo es evaluar el desempeño de los estudiantes en diferentes aspectos de la ciberseguridad y proporcionar insights para mejorar la enseñanza.

2. Generación de Datos Ficticios

Generaremos datos ficticios de evaluación sumativa para los estudiantes del curso de ciberseguridad.

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Generar datos ficticios de evaluación sumativa en ciberseguridad
np.random.seed(42)

# Datos de estudiantes
estudiantes = ['Estudiante'+str(i) for i in range(1, 101)]

# Calificaciones de módulos específicos del curso
modulos = ['Criptografía', 'Seguridad de Redes', 'Análisis de Malware', 'Gestión de Incidentes', 'Proyecto_Final']
calificaciones = np.random.randint(60, 100, size=(100, 5))

# Crear DataFrame
df_evaluacion_ciberseguridad = pd.DataFrame(calificaciones, columns=modulos, index=estudiantes)
3. Análisis de DatosRealicemos un análisis exploratorio de los datos para obtener información sobre las calificaciones.

# Estadísticas descriptivas
estadisticas_calificaciones = df_evaluacion_ciberseguridad.describe()

# Visualización de la distribución de calificaciones por módulo
plt.figure(figsize=(12, 6))
sns.boxplot(data=df_evaluacion_ciberseguridad, palette='Set3')
plt.title('Distribución de Calificaciones por Módulo')
plt.ylabel('Calificaciones')
plt.show()

# Visualización de la correlación entre módulos
plt.figure(figsize=(10, 8))
sns.heatmap(df_evaluacion_ciberseguridad.corr(), annot=True, cmap='coolwarm', fmt=".2f")
plt.title('Correlación entre Calificaciones de Módulos')
plt.show()


4. Interpretación de ResultadosExaminemos las estadísticas descriptivas y las visualizaciones para entender el rendimiento general de los estudiantes y las posibles correlaciones entre los módulos.
# Imprimir estadísticas descriptivas
print("Estadísticas Descriptivas de Calificaciones:")
print(estadisticas_calificaciones)

# Identificar estudiantes con desempeño inferior en algún módulo
estudiantes_bajo_rendimiento = df_evaluacion_ciberseguridad[df_evaluacion_ciberseguridad < 70].dropna(how='all')
print("\nEstudiantes con Desempeño Inferior en Alguno de los Módulos:")
print(estudiantes_bajo_rendimiento)

RESULTADO:
      Criptografía  Seguridad de Redes  Análisis de Malware  \
count    100.000000          100.000000           100.000000   
mean      80.940000           80.930000            79.240000   
std       11.977943           10.657434            12.841001   
min       60.000000           60.000000            60.000000   
25%       70.000000           73.000000            67.000000   
50%       82.000000           82.500000            79.500000   
75%       91.250000           90.250000            92.000000   
max       98.000000           99.000000            99.000000   

       Gestión de Incidentes  Proyecto_Final  
count             100.000000      100.000000  
mean               81.330000       79.740000  
std                11.290521       11.495823  
min                60.000000       60.000000  
25%                72.750000       70.000000  
50%                84.000000       81.000000  
75%                90.250000       91.000000  
max                99.000000       99.000000  

Estudiantes con Desempeño Inferior en Alguno de los Módulos:
               Criptografía  Seguridad de Redes  Análisis de Malware  \
Estudiante1             NaN                 NaN                  NaN   
Estudiante3             NaN                 NaN                  NaN   
Estudiante4             NaN                61.0                  NaN   
Estudiante5            61.0                 NaN                  NaN   
Estudiante7            62.0                 NaN                 66.0   
...                     ...                 ...                  ...   
Estudiante90            NaN                 NaN                 61.0   
Estudiante91            NaN                 NaN                 67.0   
Estudiante92           69.0                 NaN                  NaN   
Estudiante94            NaN                69.0                  NaN   
Estudiante100           NaN                68.0                 66.0   

               Gestión de Incidentes  Proyecto_Final  
Estudiante1                     67.0             NaN  
Estudiante3                      NaN            62.0  
Estudiante4                      NaN             NaN  
Estudiante5                      NaN             NaN  
Estudiante7                      NaN            68.0  
...                              ...             ...  
Estudiante90                     NaN             NaN  
Estudiante91                     NaN             NaN  
Estudiante92                    66.0            63.0  
Estudiante94                    68.0             NaN  
Estudiante100                    NaN             NaN  

5. Recomendaciones y MejorasBasándonos en los resultados del análisis, formularemos recomendaciones para mejorar el curso, como fortalecer ciertos módulos, proporcionar recursos adicionales o ajustar la evaluación.
6. ConclusionesLas conclusiones deben basarse en los resultados obtenidos durante el análisis. Pueden incluir:
Identificación de módulos que presentan desafíos para los estudiantes.
Reconocimiento de posibles correlaciones entre los módulos.
Identificación de estudiantes con bajo rendimiento.
Sugerencias para mejorar la calidad de la enseñanza en ciberseguridad.
7. DocumentaciónDocumenta cada paso del proyecto, desde la generación de datos hasta las conclusiones obtenidas. Esto facilitará la comprensión y replicación del análisis.
8. Presentación de ResultadosCrea informes o presentaciones que resuman los resultados del análisis, incluyendo estadísticas, visualizaciones, recomendaciones y conclusiones.
Este proyecto es un ejemplo básico y puede ser personalizado según las características específicas del curso de ciberseguridad y los objetivos del análisis de evaluación sumativa.

Análisis de Evaluación Sumativa de materia TELEINFORMATICA

Por: Julia Torrez

Proyecto de Análisis de Evaluación Sumativa para Estudiantes de Teleinformática con Pensamiento Computacional

1. Definición del Problema

Vamos a realizar un análisis de la evaluación sumativa para estudiantes de Teleinformática. El objetivo es evaluar el desempeño de los estudiantes en diferentes áreas del curso y proporcionar recomendaciones basadas en los resultados.

2. Generación de Datos Ficticios

Generaremos datos ficticios de evaluación sumativa para los estudiantes del curso de Teleinformática.

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Generar datos ficticios de evaluación sumativa
np.random.seed(42)

# Datos de estudiantes
estudiantes = ['Estudiante'+str(i) for i in range(1, 101)]

# Calificaciones de módulos específicos del curso
modulos = ['Redes de Datos', 'Protocolos de Comunicación', 'Seguridad Informática', 'Telefonía IP', 'Proyecto_Final']
calificaciones = np.random.randint(60, 100, size=(100, 5))

# Crear DataFrame
df_evaluacion_teleinformatica = pd.DataFrame(calificaciones, columns=modulos, index=estudiantes)

3. Análisis de DatosRealicemos un análisis exploratorio de los datos para obtener información sobre las calificaciones.
# Estadísticas descriptivas
estadisticas_calificaciones = df_evaluacion_teleinformatica.describe()

# Visualización de la distribución de calificaciones por módulo
plt.figure(figsize=(12, 6))
sns.boxplot(data=df_evaluacion_teleinformatica, palette='Set3')
plt.title('Distribución de Calificaciones por Módulo')
plt.ylabel('Calificaciones')
plt.show()

# Visualización de la correlación entre módulos
plt.figure(figsize=(10, 8))
sns.heatmap(df_evaluacion_teleinformatica.corr(), annot=True, cmap='coolwarm', fmt=".2f")
plt.title('Correlación entre Calificaciones de Módulos')
plt.show()

4. Interpretación de ResultadosExaminemos las estadísticas descriptivas y las visualizaciones para entender el rendimiento general de los estudiantes y las posibles correlaciones entre los módulos.
# Imprimir estadísticas descriptivas
print("Estadísticas Descriptivas de Calificaciones:")
print(estadisticas_calificaciones)

# Identificar estudiantes con desempeño inferior en algún módulo
estudiantes_bajo_rendimiento = df_evaluacion_teleinformatica[df_evaluacion_teleinformatica < 70].dropna(how='all')
print("\nEstudiantes con Desempeño Inferior en Alguno de los Módulos:")
print(estudiantes_bajo_rendimiento)

RESULTADOS:
      Redes de Datos  Protocolos de Comunicación  Seguridad Informática  \
count      100.000000                  100.000000             100.000000   
mean        80.940000                   80.930000              79.240000   
std         11.977943                   10.657434              12.841001   
min         60.000000                   60.000000              60.000000   
25%         70.000000                   73.000000              67.000000   
50%         82.000000                   82.500000              79.500000   
75%         91.250000                   90.250000              92.000000   
max         98.000000                   99.000000              99.000000   

       Telefonía IP  Proyecto_Final  
count    100.000000      100.000000  
mean      81.330000       79.740000  
std       11.290521       11.495823  
min       60.000000       60.000000  
25%       72.750000       70.000000  
50%       84.000000       81.000000  
75%       90.250000       91.000000  
max       99.000000       99.000000  

Estudiantes con Desempeño Inferior en Alguno de los Módulos:
               Redes de Datos  Protocolos de Comunicación  \
Estudiante1               NaN                         NaN   
Estudiante3               NaN                         NaN   
Estudiante4               NaN                        61.0   
Estudiante5              61.0                         NaN   
Estudiante7              62.0                         NaN   
...                       ...                         ...   
Estudiante90              NaN                         NaN   
Estudiante91              NaN                         NaN   
Estudiante92             69.0                         NaN   
Estudiante94              NaN                        69.0   
Estudiante100             NaN                        68.0   

               Seguridad Informática  Telefonía IP  Proyecto_Final  
Estudiante1                      NaN          67.0             NaN  
Estudiante3                      NaN           NaN            62.0  
Estudiante4                      NaN           NaN             NaN  
Estudiante5                      NaN           NaN             NaN  
Estudiante7                     66.0           NaN            68.0  
...                              ...           ...             ...  
Estudiante90                    61.0           NaN             NaN  
Estudiante91                    67.0           NaN             NaN  
Estudiante92                     NaN          66.0            63.0  
Estudiante94                     NaN          68.0             NaN  
Estudiante100                   66.0           NaN             NaN  

5. Recomendaciones y MejorasBasándonos en los resultados del análisis, podríamos formular recomendaciones para mejorar el curso, como reforzar ciertos módulos, proporcionar recursos adicionales o ajustar la evaluación.
6. ConclusionesLas conclusiones deben basarse en los resultados obtenidos durante el análisis. Pueden incluir:
Identificación de módulos que presentan desafíos para los estudiantes.
Reconocimiento de posibles correlaciones entre los módulos.
Identificación de estudiantes con bajo rendimiento.
Sugerencias para mejorar la calidad de la enseñanza.
7. DocumentaciónDocumenta cada paso del proyecto, desde la generación de datos hasta las conclusiones obtenidas. Esto facilitará la comprensión y replicación del análisis.
8. Presentación de ResultadosCrea informes o presentaciones que resuman los resultados del análisis, incluyendo estadísticas, visualizaciones, recomendaciones y conclusiones.
Este proyecto es un ejemplo básico y puede ser personalizado según las características específicas del curso de Teleinformática y los objetivos del análisis de evaluación sumativa.

Análisis de Evaluación Sumativa

Por: Julia Torrez

Este proyecto se enfocará en realizar un análisis de evaluación sumativa para estudiantes de telecomunicaciones. Vamos a utilizar Python y las bibliotecas pandas, matplotlib, y seaborn para realizar el análisis de datos. Asumiremos que estamos trabajando con un conjunto de datos ficticios que representa el rendimiento de los estudiantes en diferentes áreas de estudio.

Paso 1: Definición de Variables y Generación de Datos

import pandas as pd
import numpy as np
import random

# Definir el número de estudiantes y variables
num_estudiantes = 100

# Crear datos ficticios para cada estudiante
data = {
    'ID_Estudiante': range(1, num_estudiantes + 1),
    'Nombre': [f'Estudiante_{i}' for i in range(1, num_estudiantes + 1)],
    'Calificacion_Matematicas': np.random.uniform(60, 100, num_estudiantes),
    'Calificacion_Fisica': np.random.uniform(60, 100, num_estudiantes),
    'Calificacion_Tecnologia': np.random.uniform(60, 100, num_estudiantes),
    'Calificacion_Comunicaciones': np.random.uniform(60, 100, num_estudiantes)
}

df_telecom = pd.DataFrame(data)
df_telecom.to_csv('evaluacion_telecom.csv', index=False)
En este código, hemos creado datos ficticios que representan las calificaciones de estudiantes de telecomunicaciones en diferentes áreas de estudio.
Paso 2: Análisis Exploratorio de Datos (EDA)
# Cargar datos desde el archivo CSV
df_telecom = pd.read_csv('evaluacion_telecom.csv')

# Mostrar las primeras filas del DataFrame
print(df_telecom.head())

# Estadísticas descriptivas
print("\nEstadísticas Descriptivas:")
print(df_telecom.describe())

# Visualizar la distribución de calificaciones en Matemáticas
import seaborn as sns
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))
sns.histplot(df_telecom['Calificacion_Matematicas'], bins=20, kde=True)
plt.title('Distribución de Calificaciones en Matemáticas')
plt.xlabel('Calificación')
plt.ylabel('Frecuencia')
plt.show()

RESULTADO:
   ID_Estudiante        Nombre  Calificacion_Matematicas  Calificacion_Fisica  \
0              1  Estudiante_1                 83.636644            77.531944   
1              2  Estudiante_2                 99.568667            70.507732   
2              3  Estudiante_3                 66.673188            66.588710   
3              4  Estudiante_4                 61.867393            87.565734   
4              5  Estudiante_5                 91.181267            80.582845   

   Calificacion_Tecnologia  Calificacion_Comunicaciones  
0                89.438142                    62.689625  
1                72.049252                    78.587579  
2                78.535640                    92.829434  
3                83.977222                    84.581641  
4                66.850936                    93.286498  

Estadísticas Descriptivas:
       ID_Estudiante  Calificacion_Matematicas  Calificacion_Fisica  \
count     100.000000                100.000000           100.000000   
mean       50.500000                 80.280443            80.069208   
std        29.011492                 11.623540            11.797120   
min         1.000000                 60.051377            60.031580   
25%        25.750000                 70.030373            70.070555   
50%        50.500000                 81.008930            81.345096   
75%        75.250000                 89.054173            89.987363   
max       100.000000                 99.896918            99.867331   

       Calificacion_Tecnologia  Calificacion_Comunicaciones  
count               100.000000                   100.000000  
mean                 78.198287                    78.109087  
std                  11.291524                    11.367528  
min                  60.028674                    60.093899  
25%                  69.128451                    68.282728  
50%                  77.084879                    77.253058  
75%                  87.843574                    87.397398  
max                  99.453997                    99.683687  


En este paso, realizamos un análisis exploratorio de datos básico. Cargamos los datos, mostramos las primeras filas, estadísticas descriptivas y visualizamos la distribución de calificaciones en Matemáticas.
Paso 3: Visualización Multivariable
# Visualizar la relación entre las calificaciones en Física y Tecnología
sns.pairplot(df_telecom[['Calificacion_Fisica', 'Calificacion_Tecnologia']])
plt.suptitle('Relación entre Calificaciones en Física y Tecnología', y=1.02)
plt.show()


Aquí, utilizamos un gráfico de pares para explorar la relación entre las calificaciones en Física y Tecnología.
Conclusiones:Generación de Datos Ficticios: La creación de datos ficticios nos permite simular el rendimiento de los estudiantes y realizar análisis sin depender de conjuntos de datos reales.
Análisis Exploratorio de Datos: El EDA nos ha proporcionado información clave sobre la distribución de calificaciones y la relación entre diferentes áreas de estudio.
Visualización de Datos: Las visualizaciones, como histogramas y gráficos de pares, son herramientas útiles para entender la variabilidad y relaciones en los datos.
Aplicación en Telecomunicaciones: Este proyecto puede aplicarse para evaluar el rendimiento de estudiantes de telecomunicaciones en áreas específicas y proporcionar información valiosa para mejorar el proceso educativo.
Este proyecto es un ejemplo básico de análisis de evaluación sumativa para estudiantes de telecomunicaciones. Puedes personalizar y expandir este proyecto según tus necesidades específicas y la complejidad de tus datos. Recuerda que los datos utilizados son ficticios y con fines educativos. En un entorno real, trabajarías con datos reales y adaptarías tu análisis en consecuencia.

Ejemplo Practico EDA

Por: Julia Torrez

Este proyecto se centrará en un ejemplo práctico de Análisis Exploratorio de Datos (EDA) aplicado a la informática. Utilizaremos Python y las bibliotecas pandas, matplotlib y seaborn para realizar el análisis de datos. Asumiremos que estamos trabajando con un conjunto de datos ficticios que representan el rendimiento de un servidor a lo largo del tiempo.

Paso 1: Definición de Variables y Generación de Datos

import pandas as pd
import numpy as np
import random

# Definir el número de días y variables
num_dias = 30
horas_por_dia = 24

# Crear un rango de fechas y horas
fechas_horas = pd.date_range(start='2023-01-01', periods=num_dias * horas_por_dia, freq='H')

# Crear datos ficticios para el rendimiento del servidor
data = {
    'Fecha_Hora': fechas_horas,
    'Carga_CPU': np.random.uniform(0, 100, num_dias * horas_por_dia),
    'Uso_Memoria': np.random.uniform(0, 100, num_dias * horas_por_dia),
    'Transmision_Datos': np.random.uniform(0, 50, num_dias * horas_por_dia),
    'Latencia': np.random.uniform(1, 10, num_dias * horas_por_dia)
}

df_informatica = pd.DataFrame(data)
df_informatica.to_csv('datos_informatica.csv', index=False)

En este código, hemos creado datos ficticios que representan el rendimiento de un servidor a lo largo de 30 días. Las variables incluyen la carga de la CPU, el uso de la memoria, la cantidad de datos transmitidos y la latencia.
Paso 2: Análisis Exploratorio de Datos (EDA)# Cargar datos desde el archivo CSV
df_informatica = pd.read_csv('datos_informatica.csv', parse_dates=['Fecha_Hora'])

# Mostrar las primeras filas del DataFrame
print(df_informatica.head())

# Información general del DataFrame
print("\nInformación del DataFrame:")
print(df_informatica.info())

# Estadísticas descriptivas
print("\nEstadísticas Descriptivas:")
print(df_informatica.describe())

# Visualizar la evolución de la carga de la CPU y el uso de memoria
import seaborn as sns
import matplotlib.pyplot as plt

plt.figure(figsize=(12, 6))
sns.lineplot(x='Fecha_Hora', y='Carga_CPU', data=df_informatica, label='Carga de CPU')
sns.lineplot(x='Fecha_Hora', y='Uso_Memoria', data=df_informatica, label='Uso de Memoria')
plt.title('Evolución de la Carga de CPU y Uso de Memoria a lo largo del tiempo')
plt.xlabel('Fecha y Hora')
plt.ylabel('Porcentaje')
plt.legend()
plt.show()

RESULTADO: 
          Fecha_Hora  Carga_CPU  Uso_Memoria  Transmision_Datos  Latencia
0 2023-01-01 00:00:00  46.089834    26.084925          15.961265  9.777201
1 2023-01-01 01:00:00  82.870898     0.908703          45.295584  9.691934
2 2023-01-01 02:00:00  82.956272    64.829753           6.331856  2.937421
3 2023-01-01 03:00:00  70.938882    51.109382           8.925989  8.299941
4 2023-01-01 04:00:00  10.540138    44.551781          24.651506  2.775184

Información del DataFrame:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 720 entries, 0 to 719
Data columns (total 5 columns):
 #   Column             Non-Null Count  Dtype         
---  ------             --------------  -----         
 0   Fecha_Hora         720 non-null    datetime64[ns]
 1   Carga_CPU          720 non-null    float64       
 2   Uso_Memoria        720 non-null    float64       
 3   Transmision_Datos  720 non-null    float64       
 4   Latencia           720 non-null    float64       
dtypes: datetime64[ns](1), float64(4)
memory usage: 28.2 KB
None

Estadísticas Descriptivas:
        Carga_CPU  Uso_Memoria  Transmision_Datos    Latencia
count  720.000000   720.000000         720.000000  720.000000
mean    49.446196    49.885386          24.659351    5.376228
std     29.012478    28.884475          14.493192    2.564416
min      0.022704     0.709181           0.071417    1.002169
25%     24.950608    24.390017          12.363067    3.157880
50%     47.493467    49.367676          24.408143    5.339580
75%     75.159607    74.176194          37.567688    7.444150
max     99.879294    99.935030          49.973034    9.990142

En este paso, realizamos un análisis exploratorio de datos básico. Cargamos los datos, mostramos las primeras filas, información general y estadísticas descriptivas. Además, visualizamos la evolución de la carga de CPU y el uso de memoria a lo largo del tiempo.
Conclusiones:Generación de Datos Ficticios: La creación de datos ficticios nos permite simular escenarios del mundo real y realizar análisis sin depender de conjuntos de datos reales.
Análisis Exploratorio de Datos: A través del EDA, hemos obtenido información valiosa sobre el comportamiento del servidor, identificando patrones y tendencias en la carga de la CPU y el uso de memoria.
Visualización de Datos: Las visualizaciones, como el gráfico de línea, son herramientas poderosas para entender la evolución de las métricas a lo largo del tiempo.
Aplicación en Informática: Este ejemplo práctico puede ser aplicado en la monitorización y optimización del rendimiento de servidores, ayudando a identificar posibles problemas y mejorar la eficiencia.
Este proyecto proporciona una base para el análisis exploratorio de datos aplicado a la informática. Puedes personalizar y expandir este proyecto según tus necesidades específicas y la complejidad de tus datos. Recuerda que los datos utilizados son ficticios y con fines educativos. En un entorno real, trabajarías con datos reales y adaptarías tu análisis en consecuencia.