Aprendizaje por refuerzo

En este tema vamos a ver los principios y operación del aprendizaje por refuerzo, tanto tabular como con funciones de aproximación, y esto lo vamos a aplicar para hacer un agente que juegue al tetris y le gane.

Por supuesto, esto tambien lo estamos usando como pretexto para programar en go un juego de tetris en el cual se separa claramente el motor de juego de la interfase gráfica.

Objetivo del proyecto

Desarrollar un juego de Tetris en go, el cual se pueda jugar ya localmente o en red.
Desarrollar un agente que aprenda a jugar al Tetris utilizando aprendizaje por refuerzo.

Competencias a desarrollar

Conocimiento de la teoría básica de aprendizaje por refuerzo y al menos dos algoritmos básicos de aprendizaje (Q-learning y Actor-Critic).
Habilidades para el diseño y programacion de un juego de Tetris en go bien estructurado, y con HMI.
Habilidades de programación en go necesarias para el desarrollo de un motor de juego que sea suficientemente rápido para poder entrenar un agente con aprendizaje por refuerzo.
Capacidad de implementar en go técnicas de aprendizaje por refuerzo con aproximación de funciones, y ajuste de parámetros de aprendizaje en la práctica para un problema concreto.

Bibliografía básica

Reinforcement Learning: An introduction de R. Sutton y A. Barto, borrador final de la segunda edición, 7 de noviembre de 2017.
Curso de Reinforcement Learning de la maestría en Ciencias de la Computación de Georgia Tech, impartido a través de la plataforma de Udacity.

Enlaces a los proyectos y ejercicios (Evidencias para calificación)

El juego
Aprendizaje por refuerzo (ejercicios realizados)
- Fran
- Gurrola
- Erick - Barbara:
- Paty
- Rafa

Los post referentes a este proyecto se incluyen a continuación.

Aprendizaje por refuerzo

Objetivo del proyecto

Competencias a desarrollar

Bibliografía básica

Enlaces a los proyectos y ejercicios (Evidencias para calificación)

Recordatorio evaluación RL 15 May 2018

Evaluación colaborativa de ejercicios RL 26 Apr 2018

Compromisos para después de Semana Santa 22 Mar 2018

Programación dinámica en Go 02 Feb 2018

Reglas del Tetris 30 Jan 2018

Proyectos potencialmente útiles 27 Jan 2018

Golang increible (Awesome Golang) 27 Jan 2018

Comenzando con el Tetris 26 Jan 2018

Conocimientos básicos de aprendizaje por refuerzo 25 Jan 2018