「大規模言語モデル(LLM)の仕組み入門」は、ChatGPTなどで使われている大規模言語モデル(Large Language Model、LLM)の仕組みについて学ぶ講座です。
GPT-4などのLLMがどのようにして前世代のモデルを超え、AIの未来を切り開いているのかを掘り下げていきます。
可能な限り難しい数学は使わず、LLMのコードを実行する体験と共にLLMの基礎を学んでいきます。
LLMは現在様々な分野で驚異的な性能を発揮し、幅広く活用されています。
特にGPT-3.5やGPT-4が使われているChatGPTは、自然言語を使った対話により自然な文章を生成可能なので、大きな注目を集めています。
また、LLMは様々なタスクをこなせる汎用性を備えており、これまで人間しかできなかった様々なタスクを任せることが可能になってきています。
この講座では、LLMの概要を学んだ上で、ニューラルネットワークの基礎、Transformerへの発展、LLMの躍進について順を追って学んで行きます。
世界に巨大なインパクトを与えつつあるLLMの背景を、想像し活用できるようになりましょう。
注: 本コースに先立ちYouTubeでのライブ講義【Live! 人工知能】がありました。本コースの動画はこのライブ講義をUdemy用に再構成したものになります。
講座の内容は以下の通りです。
Section1. LLMの概要
→ LLMの概要や、開発環境について学びます。
Section2. ニューラルネットワークの仕組み
→ ニューラルネットワークの概要、そして学習の仕組みについて学びます。
Section3. Transformerの仕組み
→ LLMのベースであるTransformerの仕組みについて学びます。
Section4. LLMの仕組み
→ LLMの仕組みについて解説します。また、ライブラリを使った実装も行います。
なお、今回の講座でプログラミング言語Pythonの解説は最小限となりますが、Pythonの基礎を解説するノートブックを予め配布します。
Pythonの開発環境にはGoogle Colaboratoryをメインで使用します。