みんなの強化学習講座は、「強化学習」について学び、親しむためのコースです。
強化学習では、「環境において最も報酬が得られやすい行動」を「エージェント」が学習し、自発的に様々な行動パターンを獲得します。
本コースは、この強化学習の原理およびコードによる実装を基礎から丁寧に解説します。
様々な場面で応用されつつある強化学習を身に付け、活用できるようになりましょう。
注: 本コースに先立ちYouTubeでのライブ講義【Live人工知能】がありました。本コースの動画はこのライブ講義をUdemy用に再構成したものになります。
コースの内容は以下の通りです。
Section1. 強化学習の概要
→ 強化学習の全体像を把握し、開発環境であるGoogle Colaboratoryの使い方を学びます。
Section2. シンプルな強化学習
→ 最小限のPythonのコードで、強化学習の一種Q学習を実装します。
Section3. 強化学習の原理
→ 強化学習の理論、動作原理を学びます。
Section4. 深層強化学習
→ ディープラーニング(深層学習)と強化学習を組み合わせた深層強化学習について学びます。
Section5. 強化学習の応用
→ OpenAI Gymを利用して、月面着陸船の制御にトライします。また、強化学習の先端研究の紹介も行います。
なお、今回の講座でプログラミング言語Pythonの解説は最小限となりますが、Pythonの基礎を解説するノートブックがダウンロード可能です。
本コースはディープラーニング用フレームワークとしてPyTorchを、強化学習の環境としてOpenAI Gymを使用します。
また、Pythonの開発環境にはGoogle Colaboratoryを使用します。
3737
36
TAKE THIS COURSE