本コースは、人気のプログラミング言語「Python」を使って、データ分析手法を学習するコースです。
現在、Pythonはデータ分析からセキュリティまで幅広い分野で活用されており、プログラミング初心者でも学びやすい言語として注目されています。
今回はこのPythonを使って、教育データ(テストデータ)とアンケート項目の分析を行います。
難しい数学や統計学の知識は必要ありません。また、Pythonを使ったことがない人でも大丈夫。
講師が基礎から丁寧に説明しますので、肩の力を抜いて、学習を進めていきましょう。
★このコースの学び方★
本コースは、各セクションごとに「ハンズオン+練習問題+解説」という順番で進みます。
まずは、講師のライブコーディングを眺めながら、ハンズオン形式で学習を進めましょう。
セクションの最後に練習問題が用意されていますので、今度はご自身の力で課題を解いていきましょう。
最後に、講師が練習問題の解説を行いますので、うまくいかなかった人は、解説を聞いた後にもう一度、練習問題に挑戦してみましょう。
★このコースの概要★
Pythonの基礎
AnacondaとJupyter Notebookを用いて、基本的なPythonの記述方法について解説します。
[keyword]
数値演算、変数、関数とメソッド、リスト作成と操作方法、リストの要素へのアクセス、比較演算子と論理演算子、if文、For文、while文、例外とエラー
Pythonによる基本的な統計量の算出
Pythonを使って、基本的な統計量を算出します。
これから学習を進めていくデータ分析の基礎となる部分ですので、用語・手法をしっかりと理解しましょう。ヒストグラムの説明以降は、連続的に難易度が上がっていきますので、途中で理解が追い付かなくなったら、前のレクチャーに戻って疑問点を解消していきましょう。
[keyword]
パッケージ・関数の定義、ヒストグラム、代表値、分散と標準偏差、標準得点と偏差値
共分散と相関係数
Pythonによるデータの可視化
統計量の算出ができるようになったら、生成したデータを可視化しましょう。このセクションでは、matplotlibというライブラリを活用し、ヒストグラムをはじめ、複数のグラフや図表を作成します。
[keyword]
ヒストグラムと基本的な描画方法、グラフの体裁を整える、箱ひげ図、散布図
回帰分析に挑戦
コースの前半で習得した知識を用いて、回帰分析に挑戦します。
[keyword]
リスト以外のデータ構造(セット、タプル、辞書(ディクショナリ)、numpy.ndarray、ファイルの読込、外部から取得したデータの読込、回帰分析
Pandasを用いたデータの処理
Pythonのデータ解析用ライブラリであるPandasを用いて、データ分析を行います。
ここからがコースの後半戦です。
[keyword]
データの読込み、基本統計量、条件指定、データフレームの作成、欠損値の取り扱い、Pandasを用いた可視化の方法、Groupbyを用いたグルーピング、Good-Poor分析
テスト、アンケートの項目分析
いよいよ、今まで学習した知識を総動員して、テスト・アンケートの項目分析を行います。
識別力指標としての点双列相関、信頼性係数を求め、項目困難度と組合わせて、項目の性質の分析を行い、データフレームでまとめます。最終的には散布図などを生成し、データの可視化を行います。
[keyword]
項目困難度、G-P分析による識別力、識別力指標としての点双列相関、信頼性係数、データフレーム、可視化
「平均への回帰」を考慮したテストの分析
最後は練習問題です。
これまでは、皆さんのコーディングに講師が寄り添う形でコースが進められてきました。
このセクションでは、講師の助けはもう必要ありません。
今までの知識と手法を用いて、一人で課題に挑戦してみましょう!
これまでの学習が身についていれば、必ずゴールまでたどり着くはずです。