Aprendizaje por refuerzo

Tópicos Avanzados en Inteligencia Artificial

1. Temario

  1. Introducción al aprendizaje por refuerzo
  2. Método de aprendizaje Q-Learning tabular
  3. Introducción y uso de *Deep Q-Learning
  4. Métodos de aprendizaje directo de políticas (Gradient Policy)
  5. Agente con aprendizaje en Unity
  6. Métodos de Actor / Crítico en entornos robóticos
  7. Introducción al aprendizaje por refuerzo multiagente
  8. Método Proximal Policy Optimization

2. Material para el aprendizaje

3. Evaluación

Entregar, antes que acabe el semestre, el certificado de acreditación del curso de Hugging Face de aprendizaje por refuerzo profundo

Las fechas de entrega indicativas son las siguientes:

Fecha Unidad Modelos Puntaje mínimo
7 feb 1 LunarLander-v2 200
14 feb 2 Taxi-v3 4.5
14 feb 3 SpaceInvadersNoFrameskip-v4 200
21 feb 3bis MountainCar-v0 y CartPole-v1 NA
21 feb 4 Cartpole-v1 y PixelCopter 350 y 5
28 feb 5 Pyramids y SnowballTarget 1.75 y 15 aprox.
6 mar 6 PandaReachDense-v3 3.5
13 mar 7 AIvsAI-SoccerTwos No hay mínimos pero juegas contra otros agentes
20 mar 8 LunarLander-v2 NA
27 mar 8bis doom_health_gathering_supreme 5