pandasライブラリはPython3によるデータサイエンス,統計処理のためのフロントエンドです.
本コースでは,多くの書籍や教育コースで指導・解説を省略する部分(データ構造やAPIの詳細)を徹底的に実習しながら身に付けます.
渡されたサンプルコードやノートブックをそのまま実行するだけでは得られない深さと明確さで,各種のデータ構造とAPI(関数やメソッドなど)の扱い方が理解できます.
pandasライブラリが実現する情報処理はいわゆる「表計算」で,その概念はとても単純ですが,実用的な使用においては意外な程に多くの知識が求められます.従いましてpandasによる処理の考え方を理解しただけでは,自力でプログラミングすることができないという状態に陥ることが多々あります.
本コースでは,実習を通して下記のような事柄について詳しく学びます.また各種のメソッドや関数に関しても,引数の指定方法というレベルから詳しく学びます.
・Seriesオブジェクトの構造と扱い方
・DataFrameオブジェクトの構造と扱い方
・ファイル入出力の方法
・データサイエンス,統計処理を支える基本機能
・データの可視化のための基本機能
・時系列データ処理を支えるタイムスタンプの扱い方
pandasの最も基本的な機能にフォーカスして学びます関係上,ビッグデータの解析,機械学習といった高度な応用方法については言及しませんが,「pandasの機能が思ったように動いてくれない」,「記述方法の微妙な違いが理解できない」といった悩みを解決する一助にもなるかと思います.
基本機能に関する知識を確固なものにすることで,高度な応用方法の学びがスムーズなものになります.
本コースの実習には,Google Colaboratory と Google ドライブを使用します.
また,実際のコーディングの画面を提示しますので,できるだけ大きなディスプレイで受講してください.(スマホなどの小さな画面は受講に適しておりません)
本コースは大学や専門学校で実施する実習授業のスタイルに準じていますので,各レクチャーの時間がかなり長いです.各レクチャーの受講においては,適宜休憩を入れたり,複数の日に分割して受講するなど工夫して,精神的な負担にならないように心がけてください.