Aprendizaje por refuerzo y algoritmos evolutivos

Dirigido a:
. Ingenieros/as o licenciado/as en áreas afines a la electrónica, informática y/o computación

Objetivos:
. Introducir a los alumnos en el aprendizaje por refuerzo y los algoritmos evolutivos
. Comprender el significado de terminología fundamental del aprendizaje por refuerzo y los algoritmos evolutivos tal que posibilite la interacción fluida con expertos en esas áreas
. Adquirir conocimientos apropiados para determinar si un problema es plausible de ser abordado mediante tecnologías de aprendizaje por refuerzo y los algoritmos evolutivos
. Conocer ejemplos de aplicación de aprendizaje por refuerzo y los algoritmos evolutivos

Temario:
:: Asignatura: Introducción a la Inteligencia Artificial
. Introducción, Python y librerías de IA.
. Inteligencia artificial. Fundamentos y objetivos. Resolución de problemas con IA.
. Métodos de optimización. Gradiente Descendente. Recocido simulado y algoritmo genético.
. Fundamentos de aprendizaje automático. Sesgo y varianza. Sensibilidad y especificidad. Precisión y exhaustividad.
. Aprendizaje estadístico. Riesgo empírico. Datos. Entrenamiento, validación y testeo.
. Regresión Lineal. Regularización. Regresión Lasso y Ridge.
. Problema de clasificación. Regresión logística. Clasificador Bayesiano. Naive Bayes. Curva ROC.
. Aprendizaje por refuerzo. Algoritmos para el control de aprendizaje.
:: Asignatura: Aprendizaje profundo
. Redes neuronales feedforward
. Funciones de activación. Funciones de pérdida. Algoritmos de optimización.
. Regularización y ajustes de hiperparámetros en redes neuronales
. Pytorch
. Capa embeddings
. Redes neuronales convolucionales
. Redes neuronales recurrentes. Capa attention
. Redes neuronales autoencoder
. Aprendizaje por transferencia
. Redes neuronales adversarias generativas
:: Asignatura: Aprendizaje por Refuerzo I
. Procesos de decisión de Markov
. Q-Learning
. SARSA
. Deep Q-Network
. Actor-Critic (AC)
. Asynchronous Advantage Actor-Critic (A3C)
:: Asignatura: Algoritmos evolutivos
. Computación evolutiva
. Algoritmos genéticos
. Análisis y comparativa de AE
. Optimización por enjambre de partículas (PSO)
. Mejoras del algoritmo PSO
. PSO con restricciones
. PSO multiobjetivo
. Optimización basada en enseñanza-aprendizaje (TLBO)
. Optimización basada en colonia de hormigas (ACO)
. Búsqueda tabú
. Hiperheurísticas
:: Asignatura: Aprendizaje por Refuerzo II
. Optimización de políticas proximas (PPO)
. Gradiente de política determinista profunda con doble retardo (TD3)
. Soft Actor-Critic (SAC)
. Aprendizaje por refuerzo multiagente (MARL)

Docentes:
Facundo Adrián Lucianna
Marcos Uriel Maillot
Maximiliano Torti
Miguel Augusto Azar

Duración:
120 horas

Fecha de inicio:
Lunes 3 de marzo de 2025

Horario:
De 19.00 a 22.00

Informes e inscripción:
Laboratorio de Sistemas Embebidos: inscripcion.lse@fi.uba.ar