「AIによる画像分類を学ぼう!」は、CNN(畳み込みニューラルネットワーク)などをベースにした画像分類技術を学ぶ講座です。
フレームワークにPyTorchを使い、Google Colaboratory環境で様々な画像分類のモデルを実装します。
AIによる画像分類は第3次AIブームのきっかけになった技術であり、応用範囲が広く多様な分野で使われています。
本コースでは、最初にPyTorchの使い方、CNNの基礎を学んだ上で、AlexNet、ResNet、MobileNetなどの有名モデルを実装します。
さらに、Transformerを利用した画像分類モデル「Vision Transformer」(ViT)も扱います。
AIによる画像分類技術をうまく利用すれば、従来人間しかできなかったタスクの自動化が可能です。
様々な画像認識モデルの仕組みを学び、Pythonで実装できるようになりましょう。
注: 本コースに先立ちYouTubeでのライブ講義【Live! 人工知能】がありました。本コースの動画はこのライブ講義をUdemy用に再構成したものになります。
講座の内容は以下の通りです。
Section1. 画像分類の概要
→ 画像分類の概要、および開発環境について学びます。
Section2. CNNの基礎
→ 様々な画像分類技術のベースとなる、CNN(畳み込みニューラルネットワーク)について学びます。
Section3. Section4. 有名モデルの実装
→ AlexNet、ResNet、MobileNetなどの様々な有名モデルを実装します。
Section5. Transformerの利用
→ 「Transoformer」を利用した画像分類モデルを構築します。
なお、今回の講座でプログラミング言語Pythonの解説は最小限となりますが、Pythonの基礎を解説するノートブックを予め配布します。
Pythonの開発環境にはGoogle Colaboratoryを使用します。