現代のビジネスシーンでは、データを効果的に活用することが求められています。
特に、ChatGPTが登場してから、自社データをチャット形式で検索するための仕組み開発が盛んになっています。
本講座ではそのような要求に応えられるようなチャット形式のデータマイニングツールの開発をテーマに学習していきます。
本講座では、情報検索の基本からCognitive Searchの基本、そしてPDFファイルを取り込むことをテーマにデータ取り込み処理の実践的な方法を学ぶことができます。
最終的には、LangChainとGPTを組み合わせた実用的なデータマイニング可能なチャットボットをハンズオンで開発していきます。
本講座を学習することで、データを効果的に活用して価値を生み出すシステムを開発するスキルを手に入れることができます。
やってみたいと思いながら、具体的な実装方法が思いつけていない方は、ぜひ一度、本コースを受講いただければと思います。
【概要】
基礎学習
情報検索システム概要
情報検索システム、情報検索エンジン
フルテキスト検索(全文検索)の流れ、構成要素
ベクトル検索
Cognitive Search概要
基本機能
SKU
セキュリティ
監視/モニタリング
可用性、回復性
ハンズオン
全体アーキテクチャ
データ取り込み処理(ETL処理)
PDFファイル読み込み
チャンク分割
ベクトル変換(OpenAI の Embedding モデルを 利用)
Cognitive Search へ登録
Cognitive Search での検索
フルテキスト検索(全文検索)
ベクトル検索
Webアプリの実装
LangChainを使ってReActを実装(OpenAI の GPTモデル を利用)
カスタムツールにCognitive Search を実装、組み込み
LangChainの日本語化
Azure上へデプロイ
【更新履歴】
v1.0.0 2023/12/05 初版リリース