machinelearningEjerciciosTeoria

Machine learning Ejercicios y Teoria -> by @darwinyusef

1. Medidas de Tendencia Central

En esta sección, exploraremos las medidas de tendencia central que nos ayudan a entender la ubicación central de los datos en un conjunto. Aprenderemos sobre la media aritmética, la mediana y la moda.

2. Medidas de Dispersión o Variabilidad

Esta sección se enfoca en las medidas que nos indican cuánto se dispersan los datos alrededor de las medidas de tendencia central. Estudiaremos la varianza, la desviación estándar y el rango.

3. Medidas de Posición

Aprenderemos a calcular cuartiles y percentiles, que nos ayudan a entender cómo se distribuyen los datos en diferentes partes de un conjunto. También exploraremos su utilidad en la identificación de valores atípicos.

4. Gráficos y Visualizaciones

En esta sección, veremos cómo crear visualizaciones efectivas para analizar datos. Cubriremos histogramas para representar la distribución, gráficos de caja para visualizar la dispersión y diagramas de dispersión para identificar patrones.

5. Correlación y Dependencia

Aprenderemos a medir la relación entre dos variables utilizando la matriz de correlación y los coeficientes de correlación de Pearson, Spearman y Kendall. Esto nos permitirá comprender la dependencia entre variables.

6. Distribuciones Estadísticas

Exploraremos diferentes distribuciones estadísticas, incluyendo la distribución normal, la distribución uniforme y más. Veremos cómo estas distribuciones modelan diferentes tipos de datos.

7. Medidas de Asimetría y Curtosis

En esta sección, analizaremos cómo la asimetría y la curtosis describen la forma y simetría de una distribución. Aprenderemos sobre el coeficiente de asimetría y el coeficiente de curtosis.

8. Valores Atípicos y Datos Anómalos

Veremos cómo identificar valores atípicos en un conjunto de datos y cómo estos valores pueden afectar nuestras conclusiones. Discutiremos cómo manejar y tratar los valores atípicos.

9. Tablas de Contingencia y Cruzadas

Aprenderemos a crear y analizar tablas de contingencia que nos ayudan a explorar la relación entre variables categóricas. Utilizaremos pruebas de independencia para evaluar la dependencia entre categorías.

10. Estadísticas Resumen y Resumen Descriptivo

Exploraremos cómo resumir datos numéricos y categóricos utilizando estadísticas como la media, mediana y moda para datos numéricos, y frecuencias absolutas y relativas para datos categóricos.

11. Medidas de Centralización para Datos Agrupados

Veremos cómo calcular medidas de tendencia central en conjuntos de datos agrupados. Estudiaremos la media aritmética ponderada, la media geométrica y la media armónica.

12. Normalización y Estandarización

Aprenderemos cómo normalizar y estandarizar datos para llevarlos a una misma escala. Exploraremos técnicas como Z-scores y Min-max scaling.

Este temario proporciona una base sólida en estadística descriptiva para la ciencia de datos. Cada sección aborda conceptos clave y técnicas importantes para comprender y analizar datos de manera efectiva.