データ分析に特化したフリーソフトウェアであるR言語を基礎から紹介します。
AI開発(機械学習モデル作成)に関わる前に、データを操作する方法を十分に知っていることが求められます。
データサイエンス分野に必要なスキルは、コンペティションのようにモデル化を行うスキルだけではありません。
どのようなツールを使っても、「データベースへの接続、前処理、特徴量合成」等を全自動で行うことはできません。
モデル作成以前にデータの性質や統計量の調査、可視化などが必要になります。
分析や調査内容をステークホルダーに説明するためにスライドやpdfなどのレポート形式に変換する手間も発生します。
その作業はデータサイエンス業務の約8割を占めると言われるほどに重要であるにも関わらず、業務の核心に近い知識となってしまうためノウハウが共有されることがありません。
本コースでは、「R」「Rstudio」「 tidyverseをはじめとする便利なパッケージや関数の活用方法」を知ることで、
前例のないデータ構造や問題にも立ち向かえるレベルに成長して頂くために、このコースを設計しました。
R言語を知らない方にも「R言語を起点にデータサイエンスへ入門しよう」と思っていただけるよう、最先端の機能だけでなく従来まで使われてきた機能も振り返りながら紹介しています。
■使用環境:
・windows 10
・R 4.0.5
・Rstudio 1.4.1717
・nycflights13,palmerpenguins,devtools,remotes,usethis,vctrs,httr,tidyverse,tidyselect,here,janitor,skimr,lubridate,hms,slider,glue,
・broom,fs,data.table,dtplyr,tictoc,readxl,vroom,DBI,RSQLite,reprex,odbc,RODBC,reticulate,
・gapminder,dbplyr,prettycode,styler,testthat,bench,parallelly,parallel,furrr,multidplyr,rsthemes,
・scales,cowplot,patchwork,withr,ProjectTemplate,scatterplot3d,haven,kableExtra,knitr,xaringan,revealjs
■得られる知識:
・「RやRstudio」を使うと、どのようなことが実現出来るのかを知ることができる
・データサイエンスに利用する上で最低限どんな知識が必要かを知ることができる
・tidyverseをはじめとしたパッケージや、便利な機能を持った関数群をインストール方法から紹介する
・便利な機能や実践的な使用例をかみ砕いて紹介する
・様々なユーザーパターンを想定し、幅広いデータファイルへの接続方法や操作方法を紹介する
・スライドショーや報告レポート化する機能を使い、低ストレスで分析内容を資料化する方法を紹介する
170
126
TAKE THIS COURSE