Programación y Tecnología

Ciencia de Datos | Data Science | Python

Esta serie de videos explica los siguientes temas dentro del dominio de la ciencia de datos o data science: - Imputación o manejo de datos faltantes - Codificación de datos categóricos - Técnicas de escalamiento, normalización y estandarización. - Validación cruzada (cross-validation) - Ajuste de hiperparámetros - Técnicas para lidiar con clases desbalanceadas - Distribución de datos e histogramas - Detección de datos anómalos con diagramas de caja y la regla de Tukey - Detección de datos anómalos con iForests (bosques de aislamiento) - Regresión lineal - K-vecinos más cercanos para clasificación - K-vecinos más cercanos para regresión. - Conjuntos de clasificadores o regresores (Bagging) - Regresión logística - Impureza Gini - Bosques aleatorios para clasificación - Objetivos de los conjuntos de datos para entrenamiento, validación y prueba - La maldición de la dimensionalidad - Fuentes de datos - Detección de clusters con k-means - Detección de clusters con DBSCAN - Tipos de distancias para Clustering - Métricas de regresión. - Visualización de datos con matplotlib - Manejo y análisis de datos con pandas Las librerías que se utilizan son scikit-learn (sklearn), matplotlib, numpy y pandas.

Codigo Maquina
41h 39m
117 lecciones
principiante4.5(4 valoraciones)
Ciencia de Datos | Data Science | Python
Empezar curso gratis

No requiere registro

Lo que aprenderás

  • Comprender el proceso completo de análisis de datos
  • Recopilar, limpiar y transformar conjuntos de datos
  • Crear visualizaciones de datos informativas y atractivas
  • Aplicar estadística descriptiva e inferencial
  • Extraer insights accionables de grandes volúmenes de datos

Descripción del curso

Esta serie de videos explica los siguientes temas dentro del dominio de la ciencia de datos o data science: - Imputación o manejo de datos faltantes - Codificación de datos categóricos - Técnicas de escalamiento, normalización y estandarización. - Validación cruzada (cross-validation) - Ajuste de hiperparámetros - Técnicas para lidiar con clases desbalanceadas - Distribución de datos e histogramas - Detección de datos anómalos con diagramas de caja y la regla de Tukey - Detección de datos anómalos con iForests (bosques de aislamiento) - Regresión lineal - K-vecinos más cercanos para clasificación - K-vecinos más cercanos para regresión. - Conjuntos de clasificadores o regresores (Bagging) - Regresión logística - Impureza Gini - Bosques aleatorios para clasificación - Objetivos de los conjuntos de datos para entrenamiento, validación y prueba - La maldición de la dimensionalidad - Fuentes de datos - Detección de clusters con k-means - Detección de clusters con DBSCAN - Tipos de distancias para Clustering - Métricas de regresión. - Visualización de datos con matplotlib - Manejo y análisis de datos con pandas Las librerías que se utilizan son scikit-learn (sklearn), matplotlib, numpy y pandas.

Contenido del curso (117 lecciones)

1

Escalamiento, Normalización y Estandarización de Datos con Python para Ciencia de Datos

30m
2

Por qué y cómo codificar datos Categóricos Ordinales usando Python con sklearn y pandas

36m
3

Análisis de Componentes Principales (PCA) para Reducir la Dimensionalidad de Datos usando Python

26m
4

Detección de Datos Anómalos (outliers) con Bosques de Aislamiento (iForests) y Python

18m
5

Las Mejores Métricas para Evaluar Modelos de Regresión con Scikit-Learn: R2, MSE, RMSE, MAE y otras

20m
6

Codifica datos categóricos nominales para Machine Learning y Ciencia de Datos con Python

19m
7

Fuentes de Datos que todo Científico de Datos debe conocer: Kaggle y más

25m
8

Distribución de Datos e Histogramas con Python

20m
9

Imputación (o Manejo de Datos Faltantes) con Python

23m
10

Diagramas de Caja (BoxPlots) y Datos Anómalos (outliers) con la Regla de Tukey en Python

17m
11

Visualización de Datos usando Matplotlib de Python - Curso introductorio a la creación de gráficas

42m
12

Filtra Datos en DataFrames de Pandas para un mejor Análisis de Datos con Python

21m
13

Cargar datos de Excel y CSV a DataFrames de Pandas con Python

29m
14

Maneja y Analiza Datos con DataFrames de Pandas y Python

50m
15

Series de Pandas: El Componente Principal de los DataFrames para Analizar Datos con Python

27m
16

Jupyter Notebook: Herramienta para el Análisis de Datos con Python

24m
17

Correlación de Pearson y cómo crear Mapas de Calor de la Matriz de Correlaciones con Python

26m
18

Regresión Lineal con Python

18m
19

K-Vecinos Más Cercanos (KNN) para Clasificación con Python

29m
20

Datos de Entrenamiento, Validación y Prueba: ¿Cómo crearlos y qué objetivos tienen? Machine Learning

27m

Valoraciones del curso

Sé el primero en valorar este curso

Inicia sesión para valorar este curso y ayudar a otros estudiantes.

Iniciar sesión

Cursos relacionados