深度强化学习2.0 (Deep Reinforcement Learning 2.0)

深度Q-learning，策略梯度，演员评论家模型以及DDPG模型的完美结合

Ratings 5.00 / 5.00

深度强化学习2.0 (Deep Reinforcement Learning 2.0)

What You Will Learn!

Q-Learning
深度Q-Learning
策略梯度
演员评论家模型
深度确定性策略梯度（DDPG）
双延迟DDPG
深度强化学习的基本技术
如何运用最先进的AI技术训练模型来解决最具有挑战性的问题

Description

欢迎来到深度强化学习2.0！

在这个课程中，我们回学习并且实现一个新的AI模型，较早双延迟DDPG。它是包括了当前最先进的人工智能技术，包括连续性双深度Q-learning，策略梯度，以及演员评论家模型。这个模型非常的强大，利用它，我们可以在课程中第一次解决最具有挑战性的AI问题（训练一个蚂蚁/蜘蛛，以及一个半人形机器人，让它走路或者跑过原野）。

为了构建这个模型，我们分成三步来处理：

第一部分：基础讲解

在这一部分中，我们会学习人工智能的所有必须基础部分。这部分之后，大家可以掌握AI的基础知识，其中包括，Q-Learning,深度Q-learning,策略梯度，演员评论家模型以及更多。

第二部分：双延迟DDPG理论

这一部分中我们会深入学习整个模型背后的理论知识。大家会通过一系列的视觉呈现幻灯片，清楚看到完整的AI构建以及训练的过程。不仅大家可以学到理论知识的细节，同时还可以构建坚实的AI学习以及运作的理论基础。第一部分中的理论基础，结合第二部分的细节解释，会让这些高不可攀的技术，在你面前变得唾手可得。最终大家会成为，少数一批最先掌握这门技术的人。

第三部分：双延迟DDPG的实现

我们会从最基础开始构建这个模型，一步一步，通过互动的部分，这也是这一课程新增加的一个亮点，大家可以自己练习代码的实现部分，跟我们一起进行模型的实现。通过这些练习，大家不再只是被动地跟着课程走，而是主动地、更有效地提高技术。最后还有一点很重要的是，我们所有的实现部分都会放在Colaboratory中来做，也叫做Google Colab，这是一个完全免费的开源的人工智能平台，让大家可以进行编码，训练AI模型，而免去在自己的机器上安装各种资源包的困扰。换句话说，大家在执行代码的时候，可以百分百的确信，可以最后拿到蜘蛛以及半人形机器人的训练视频。