※当コースは,前作「AIエンジニアが教えるPythonによるデータの前処理」の内容をpolarsでアレンジしたものになります.(numpyとplotnineは当コースの対象外です。)
当コースは,データの前処理に特化しています.
近年はDXやAIが話題になっており,実に様々な方々が興味を持っている分野だと思います.
DXやAIによる成果に焦点が当たる場合が多いですが,その成果が出る前には必ずデータの前処理をする必要があります.
データの前処理は,データの読み込み,加工,結合,可視化など実に様々な工程を何回も繰り返すことで,徐々に完成に近づいていきます.
そのことが原因で,データの前処理には多大な時間(データ分析プロジェクト全体の70%~80%程度)が費やされるのです.
そんな多大な時間が費やされるデータの前処理ですが,後工程の成果物につながる重要な工程ですので,できるだけ速く正確に実施する必要があります.
データの前処理は,今まではPythonのpandasというパッケージがデファクトスタンダードでした。
ところがpandasは、コーディングが難しく、扱うのが難しいという欠点があります。
そのようなpandasに取って代わる可能性があるのがpolarsというパッケージです!
polarsはpandasと比較し、以下のようなメリットがあります。
インデックスがない!
書きやすい!
高速!
polarsを利用すれば今まで時間がかかっていたデータの前処理をサクサクッと実施することができます。
当コースでは,そんな最先端のパッケージであるpolarsについて詳細に説明します.
またpolarsだけでなく,環境構築やPythonの基礎についても丁寧に説明しますので,今までプログラミングをしたことがない初心者でも全く問題ないです.
講師が基礎から丁寧に解説しますので,気楽に一歩一歩着実に学習し,前処理マスターを目指しましょう!!
◆本コースの目的◆
データの前処理のほぼすべて(80%程度)に対応すること
◆本コースの特徴◆
とにかく現場主義!!
コーディングはリアルタイム形式!!
コードだけでなく,イメージも!!
◆本コースの内容◆
コース紹介
概要
当コース受講における注意
全体像
環境構築
Google Colaboratoryを利用するための準備
Google Colaboratoryの基本的な使い方
当コースの受講方法
Python
データ型
リスト
辞書
条件分岐処理
繰り返し処理
関数
クラス
パッケージ
polars
データの入出力
メソッドチェーン
データフレーム処理
文字列処理
繰り返し処理
欠損値処理
総合演習