はじめに
ひょんなことからデータサイエンスを学ぶことになった私ILab_01が、データサイエンスの習得に必要な知識を網羅的にまとめることを試みる記事です。
記事は逐次公開していく予定で、日を追うごとに学習内容の網羅性が向上していくという形式をとります。
想定読者としては、今のところ他分野のエンジニアを想定しており、下記のような人を想定しています。
※下記の前提知識は最終的には本サイトから提供するかもしれません。
- 何らかのプログラミング言語を使用した経験がある (変数、関数、条件分岐、繰り返し等の意味は知っている)
- 数学のうち、初歩的なことは知っている
- 線形代数の基本を知っている (行列の足し算、掛け算、内積の計算方法を知っている)
- 微分の意味が分かる (傾きを求めているんだなぁレベルでOK)
執筆のきっかけ
データサイエンスは下記の図のように、プログラミング、数学・統計学、ビジネス・データの背景知識を必要とする学習分野となります。
上記のうち、知識の部分は人それぞれ学ぶべきものが異なると思いますが、技術の部分は共通しているはずです。
しかし、私がデータサイエンスを学んだとき、技術の部分を網羅的に学ぶことができる資料が少ないように感じました。
そこで、本サイトではデータサイエンティストを目指すために必要な技術の部分の情報を可能な限り網羅的に提供することを目指します。
今後の流れ
下記の目次が完成することを目指します。(目次は日々改善していく予定です)
- データサイエンスの必要性
- Python入門
- Pythonデータ分析入門
- 統計学入門
- 多変量解析入門
- 探索的データ分析の演習
- 機械学習入門
- 深層学習入門
- モデル構築演習
- その他「やってみた」系記事の投稿
なお、各記事は試行錯誤の段階から公開していきますので、書きやすい部分から書きます。
そのため、必ずしも順番通りの解説にならないことがありますので、ご了承ください。
最終的には順番通りに書き直し、内容も精査したものを改めて公開することになります。