Transformers: Redes Sin Recurrencias, Sólamente Atención | Clase 19| Curso Aprendizaje Profundo 2021
Ya has superado la mitad. Estás muy cerca de completar el curso.
Sobre esta lección
En la clase de hoy vamos a hablar sobre los Transformers, que se han convertido en cuestión de pocos años en la arquitectura de Red Neuronal con mayor potencial en el campo del Deep Learning. La mayoría de las abismales avances de los últimos 5 años en NLP se basan enteramente en estas arquitecturas así que vamos a ver por qué son tan útiles y qué ventajas tienen sobre las RNN. Esta clase es parte de un curso gratuito dictado en la Ciudad de Mendoza, Argentina en Otoño de 2021. Podés encontrar todo el material en https://datitos.github.io/curso-aprendizaje-profundo/2021/ Limitaciones de Redes Recurrentes (0:00) ¿Qué es un Transformer? [1] (5:27) Partes de un Transformer: Feed Foward (MLP) en Transforemers (10:43) ¿Qué mejoras hacen a los Transformes un mejor modelo? (14:48) Encoder de un Transformers (23:05) Decoder en un Transformers (27:55) [1] Attention is all you need https://arxiv.org/abs/1706.03762
Sobre este curso
https://datitos.github.io/curso-aprendizaje-profundo En los últimos cinco años el aprendizaje profundo ha tomado al mundo por sorpresa, impulsando un rápido progreso en campos tan diversos como la visión por computadora, el procesamiento del lenguaje natural, el reconocimiento automático del habla, el aprendizaje por refuerzos y el modelado estadístico. Hemos elegido basar el curso en el libro Dive into Deep Learning, consideramos que ofrece un enfoque práctico, amplio y moderno, incluye matemáticas y código, y sus contenidos son actuales. Este curso representa nuestro intento de hacer que el aprendizaje profundo sea accesible, enseñándote los conceptos, el contexto y el código. Nos propusimos crear un recurso que simultáneamente pudiera: * estar disponible gratuitamente para todes; * ofrecer suficiente profundidad técnica para * proporcionar un punto de partida en el camino de convertirte en unx científicx de datos; * incluir código ejecutable, que muestre cómo resolver problemas en la práctica. El curso está dirigido a estudiantes de grado o posgrado, ingenierxs e investigadores que busquen un conocimiento sólido del aprendizaje profundo.
Lo que aprenderás en este curso:
- Comprender los fundamentos del aprendizaje automático
- Implementar algoritmos de clasificación y regresión
- Preparar y limpiar datos para modelos predictivos
- Evaluar y optimizar modelos de machine learning