データ分析や機械学習の分野において、正しく因果関係を理解し、データに基づく意思決定を行うことが年々重要になってきました。このような学問分野は因果推論と呼ばれ、近年注目され始めています。
しかし、データから因果関係を知ろうとすると、そこにはさまざまなトラップが潜んでおり、正しく推定することが難しく、誤った結論につながってしまうことがあります。
そこで本コースでは、因果推論の理論を学びながらPythonを使って実践することで、データから効果を推定する手法を学んでいきます。
コースの概要:
イントロと擬似相関
データの見方と相関関係が生まれてしまう状況を紹介します。
d分離
因果関係の特定において、変数を特定するためにd分離は重要なツールとなります。因果効果の正確な推定に向けたd分離法やざっと学びます。PythonのDoWhyパッケージを用いて演習します。
傾向スコアとIPW
傾向スコアの定義と、逆確率重み付け(Inverse Probability Weighting、IPW)を使用した、因果効果の推論手法を学びます。これにより、観測データの偏りを補正し、より正確な因果関係の推定が可能になります。PythonのDoWhyパッケージを用いて演習します。
Meta-learners
Meta-Learnersという手法を使用して、因果効果を推定する手法を学びます。EconMLというPythonパッケージを用いて、S-Learner, T-Learner, X-Learnerを実装します。
アップリフトモデリング
顧客の行動や意思決定に対する効果を評価するための手法としてアップリフトモデリングを学びます。個々の特性に応じた効果を推定するためのスキルを習得します。
対象と前提知識
本コースは、データサイエンティストやアナリスト、マーケターなど、データを活用する方に向けて作られています。
Pythonの基本的な知識や機械学習の基本的な理解があるとよいですが、必須ではありません。