自由脳PLACE – 自由で豊かな発想を身につける

← 一覧へ戻る ← 戻る次へ →

東京大学のデータサイエンティスト育成講座――Pythonで手を動かして学ぶデータ分析

著者：塚本邦尊／山田典一／大澤文孝　監修：中山浩太郎　協力：松尾豊
出版社：マイナビ出版
出版日：2019/03/14
ISBN：9784839965259

書評

東大の人気講座をベースに、Pythonで手を動かしながら「データ取得→加工→可視化→統計→機械学習」まで一気通貫で学ぶ実践書。実データ・前処理・演習が多く、知識を“使える形”で積み上げられる。独学で迷いやすい全体像の地図になる。

【本書のテーマ】
データサイエンティストに必要な技能を、点ではなく“流れ”として身につけるための講座型テキスト。Python 3を使い、データを集め、整え、読み解き、モデルにするまでを一冊で通す。

【カバー範囲｜改行後：何を学ぶ？】
基礎的なPythonに始まり、Numpy/Scipy/Pandas/Matplotlibの扱い、確率・統計（推定・回帰など）、欠損・異常値や時系列などの前処理、そして教師あり／教師なし学習やチューニングまでを扱う。 “分析の現場で詰まりやすい所”を先に踏ませる設計が強い。

【効きどころ｜改行後：どこが実務寄り？】
多くの入門が「手法の説明」で止まるのに対し、本書は“モデリング前の加工”や「実データで試す」比重が高い。つまり、Kaggle的な理想データではなく、現場の汚いデータと向き合う筋力がつく。

【注意点｜改行後：向き不向き】
対象読者として、プログラミング経験と大学初年級レベルの数学（線形代数・微積・確率統計の基礎）を前提にしている。完全初学者が“最初の1冊”にすると密度が高いので、基礎を補助しながら進めるのが安全。

【読後の実装】
読み方のコツは「章を読む→手を動かす→自分のデータで置き換える」の3段。特に前処理（欠損・異常値・時系列）だけでも、自分の業務/趣味データで再現すると“使える感”が一気に立ち上がる。