Ciencia de Datos | Data Science | Python
Esta serie de videos explica los siguientes temas dentro del dominio de la ciencia de datos o data science: - Imputación o manejo de datos faltantes - Codificación de datos categóricos - Técnicas de escalamiento, normalización y estandarización. - Validación cruzada (cross-validation) - Ajuste de hiperparámetros - Técnicas para lidiar con clases desbalanceadas - Distribución de datos e histogramas - Detección de datos anómalos con diagramas de caja y la regla de Tukey - Detección de datos anómalos con iForests (bosques de aislamiento) - Regresión lineal - K-vecinos más cercanos para clasificación - K-vecinos más cercanos para regresión. - Conjuntos de clasificadores o regresores (Bagging) - Regresión logística - Impureza Gini - Bosques aleatorios para clasificación - Objetivos de los conjuntos de datos para entrenamiento, validación y prueba - La maldición de la dimensionalidad - Fuentes de datos - Detección de clusters con k-means - Detección de clusters con DBSCAN - Tipos de distancias para Clustering - Métricas de regresión. - Visualización de datos con matplotlib - Manejo y análisis de datos con pandas Las librerías que se utilizan son scikit-learn (sklearn), matplotlib, numpy y pandas.
No requiere registro
Lo que aprenderás
- Comprender el proceso completo de análisis de datos
- Recopilar, limpiar y transformar conjuntos de datos
- Crear visualizaciones de datos informativas y atractivas
- Aplicar estadística descriptiva e inferencial
- Extraer insights accionables de grandes volúmenes de datos
Descripción del curso
Esta serie de videos explica los siguientes temas dentro del dominio de la ciencia de datos o data science: - Imputación o manejo de datos faltantes - Codificación de datos categóricos - Técnicas de escalamiento, normalización y estandarización. - Validación cruzada (cross-validation) - Ajuste de hiperparámetros - Técnicas para lidiar con clases desbalanceadas - Distribución de datos e histogramas - Detección de datos anómalos con diagramas de caja y la regla de Tukey - Detección de datos anómalos con iForests (bosques de aislamiento) - Regresión lineal - K-vecinos más cercanos para clasificación - K-vecinos más cercanos para regresión. - Conjuntos de clasificadores o regresores (Bagging) - Regresión logística - Impureza Gini - Bosques aleatorios para clasificación - Objetivos de los conjuntos de datos para entrenamiento, validación y prueba - La maldición de la dimensionalidad - Fuentes de datos - Detección de clusters con k-means - Detección de clusters con DBSCAN - Tipos de distancias para Clustering - Métricas de regresión. - Visualización de datos con matplotlib - Manejo y análisis de datos con pandas Las librerías que se utilizan son scikit-learn (sklearn), matplotlib, numpy y pandas.
Contenido del curso (117 lecciones)
Escalamiento, Normalización y Estandarización de Datos con Python para Ciencia de Datos
Por qué y cómo codificar datos Categóricos Ordinales usando Python con sklearn y pandas
Análisis de Componentes Principales (PCA) para Reducir la Dimensionalidad de Datos usando Python
Detección de Datos Anómalos (outliers) con Bosques de Aislamiento (iForests) y Python
Las Mejores Métricas para Evaluar Modelos de Regresión con Scikit-Learn: R2, MSE, RMSE, MAE y otras
Codifica datos categóricos nominales para Machine Learning y Ciencia de Datos con Python
Fuentes de Datos que todo Científico de Datos debe conocer: Kaggle y más
Distribución de Datos e Histogramas con Python
Imputación (o Manejo de Datos Faltantes) con Python
Diagramas de Caja (BoxPlots) y Datos Anómalos (outliers) con la Regla de Tukey en Python
Visualización de Datos usando Matplotlib de Python - Curso introductorio a la creación de gráficas
Filtra Datos en DataFrames de Pandas para un mejor Análisis de Datos con Python
Cargar datos de Excel y CSV a DataFrames de Pandas con Python
Maneja y Analiza Datos con DataFrames de Pandas y Python
Series de Pandas: El Componente Principal de los DataFrames para Analizar Datos con Python
Jupyter Notebook: Herramienta para el Análisis de Datos con Python
Correlación de Pearson y cómo crear Mapas de Calor de la Matriz de Correlaciones con Python
Regresión Lineal con Python
K-Vecinos Más Cercanos (KNN) para Clasificación con Python
Datos de Entrenamiento, Validación y Prueba: ¿Cómo crearlos y qué objetivos tienen? Machine Learning
Valoraciones del curso
Sé el primero en valorar este curso
Inicia sesión para valorar este curso y ayudar a otros estudiantes.
Iniciar sesión