Reinforcement Learning Avanzado: Política Gradiente

Name: Reinforcement Learning Avanzado: Política Gradiente
Brand: Udemy
SKU: 5703344
Rating: 5 (9 reviews)

Crea agentes inteligentes con Deep Reinforcement Learning y PyTorch: PPO, TRPO, A2C, REINFORCE

Ratings 5.00 / 5.00

Reinforcement Learning Avanzado: Política Gradiente

What You Will Learn!

Dominar algunos de los algoritmos más avanzados del Reinforcement Learning
Aprende a crear inteligencias artificiales que puedan actuar en un entorno complejo para alcanzar sus objetivos.
Crea desde cero agentes avanzados de Aprendizaje por Reforzamiento utilizando las herramientas más populares de Python (PyTorch Lightning, Gym, Brax, Optuna)
Aprende a realizar ajuste de hiperparámetros (selección de las mejores condiciones experimentales para que nuestra inteligencia artificial aprenda).
Comprende fundamentalmente el proceso de aprendizaje de cada algoritmo.
Depurar y extender los algoritmos presentados.
Comprende e implementa nuevos algoritmos a partir de artículos de investigación.

Description

Esta es la serie de cursos más completa sobre Reinforcement Learning en Udemy. En ella, aprenderás a implementar algunos de los algoritmos de Deep Reinforcement Learning más poderosos en Python utilizando PyTorch y PyTorch Lightning. Implementarás desde cero algoritmos adaptativos que resuelven tareas de control basadas en la experiencia. Aprenderás a combinar estas técnicas con Redes Neuronales y métodos de Aprendizaje Profundo para crear agentes de Inteligencia Artificial adaptativos capaces de resolver tareas de toma de decisiones.

Este curso te introducirá al estado del arte en técnicas de Reinforcement Learning. También te preparará para los cursos siguientes en esta serie, donde exploraremos otros métodos avanzados que destacan en otros tipos de tareas.

El enfoque del curso está en desarrollar habilidades prácticas. Por lo tanto, después de aprender los conceptos más importantes de cada familia de métodos, implementaremos uno o más de sus algoritmos en cuadernos de Jupyter, desde cero.

Módulos de nivelación:

- Actualización: El proceso de decisión de Markov (MDP).

- Actualización: Métodos de Monte Carlo.

- Actualización: Métodos de diferencia temporal.

- Actualización: Bootstrap de N pasos.

- Actualización: Breve introducción a las Redes Neuronales.

- Actualización: Métodos de política gradiente.

Aprendizaje por Reforzamiento Avanzado:

- REINFORCE

- REINFORCE para espacios de acción continuos

- Actor-crítico de ventaja (A2C)

- Métodos de región de confianza

- Optimización de política de proximal (PPO)

- Estimación de ventaja generalizada (GAE)

- Optimización de política de región de confianza (TRPO)

Who Should Attend!

Desarrolladores que deseen conseguir un empleo en el campo del Machine Learning.
Científicos/analistas de datos y profesionales del Machine Learning que buscan ampliar sus conocimiento.
Estudiantes e investigadores de robótica.
Estudiantes e investigadores de ingeniería.

TAKE THIS COURSE

Subscribers

Lectures