Este es el curso más completo de Reinforcement Learning en español. En él conocerás los fundamentos del Reinforcement Learning (aprendizaje por refuerzo), uno de los tres paradigmas de la inteligencia artificial moderna. En él implementarás desde cero algoritmos adaptativos que resuelven tareas de control en base a la experiencia. También aprenderás a combinar estos algoritmos con técnicas de Deep Learning (aprendizaje profundo) y redes neuronales, dando lugar a la rama conocida como Deep Reinforcement Learning (aprendizaje por refuerzo profundo).
Este curso es el primero de la serie "Reinforcement Learning de principiante a maestro" y te dará las bases necesarias para que seas capaz de comprender nuevos algoritmos a medida que vayan apareciendo. También te preparará para los siguientes cursos de esta serie, en los que profundizaremos mucho más en distintas ramas del Reinforcement Learning y veremos algunos de los algoritmos más avanzados que existen.
El curso está enfocado a desarrollar habilidades prácticas. Por eso, después de conocer los conceptos más importantes de cada familia de métodos, implementaremos uno o más de sus algoritmos en libretas de código, desde cero.
Este curso está dividido en tres partes y abarca los siguientes temas:
Parte 1 (Métodos tabulares):
- Proceso de decisión de Markov
- Programación dinámica (dynamic programming)
- Métodos Monte Carlo (Monte Carlo methods)
- Métodos de diferencias temporales (SARSA, Q-Learning)
- Bootstrapping en n pasos
Parte 2 (Adaptación a espacios de estados continuos):
- Agregación de estados
- Tile Coding
Parte 3 (Deep Reinforcement Learning):
- Deep SARSA
- Deep Q-Learning
- REINFORCE
- Advantage Actor-Critic / A2C (método actor crítico por ventaja)