機械学習向けの著者のお薦め書籍について,このページでは紹介していく.データサイエンティストが用いる「データサイエンス」向けの書籍を列挙する
紹介記事も書いたものは,その記事へのリンクも添えている.
1. Kevin Patrick Murphy氏の「機械学習」テキスト
1.1 PML-book の新作2冊 (2022, 2023)
- Probabilistic Machine Learning: An Introduction, (基礎編) Kevin. P. Murphy, MIT press, March, 2022.
- うちのサイトでも,新たに教科書に加えた本
- 前作 (1.2節)と比べて,新規に追加されたDeep Learning系の各章が非常に簡潔なおかげで,全体像の見晴らしが良くなった(※
- Probabilistic Machine Learning: Advanced Topics(予約開始) , (応用編:2023発売予定) Kevin. P. Murphy, MIT press, 2023.
※ 前作(1.2節)は,各アルゴリズムの解説がより細かったぶん,本全体像の見晴らしは悪かった.これが,私が「本でなくWebサイトでWikiにするべきだ」「各ページに分離して,簡潔な構成にすると,各用語のについての内容を詳しくしても読みやすいはず」と考えるに到った理由であもある.→ 詳しくは About | サイトと管理人について を参考のこと.
1.2 PML-book 過去のもの (2012)
- Machine Learning: A Probablistic Perspective Kevin. P. Murphy
2. 初心者向けの,機械学習おすすめ書籍
2.1 ビジュアルテキスト パターン認識
- ビジュアルテキスト パターン認識 荒井秀一 (2021):
- シリーズ名のとおり,豊富な図つきで,ベイズ統計モデルに入門するのに最適である.可視化が丁寧にされているので,式と文章だけで終わる機械学習本が多い中で,この本は機械学習初心者には,各学習モデルが理解しやすいはずだ.
- これまで日本語の機械学習の本は、この本のような「簡潔性」「わかりやすさ」が両立されている本はなかった.
- ただ,(ベイズ)識別モデル系のみに内容はフォーカスされているので,網羅的ではない.ベイズも入門のみで,グラフィカルモデルまでは突入しない.
- Computer Vision: Models, Learning, and Inference (2012)も昔あったが,CV限定なので,汎用的な機械学習・パターン認識を学べる本ではない.
2.2 Machine Learning: An Algorithmic Perspective
- Machine Learning: An Algorithmic Perspective, Second Edition, Stephen Marsland, Chapman and Hall/CRC ,2014.
- 私修士出て4年後の2011年に,博士課程で慶應に戻って以降,博士課程中に機械学習を復習・独習する際にお世話になった教科書.その「改訂2版」に相当するのがこの2nd edition.
- 「Pythonのゼロから実装つきで,sciki-learnに用意されている「深層学習以前のmachine learning」の全般について,わかりやすい学生向けの説明で一通り学べる,非常に良い本であった(当時としてはであるが).
- 今となっては,上で紹介したpml-bookが存在するが,平易にかつ網羅的に機械学習の勉強しやすい書籍は,英語本だと Elements~(統計的学習の基礎) くらいしかない時代.その時代に「Python実装つき」「説明も簡潔でわかりやすい」という神本であった.
- というわけで,今この時代に有用な本ではないが,深層学習の前段階として,機械学習の初歩をざっと勉強するには今でも良い本であるはず.Pythonとscikit-learnで遠州みたいなデータサイエンスや情報系学科の大学授業があれば,本書の内容はベストマッチするはずである(ただ,日本語版がないので,教員の方も本書を使えないだろうが)
3. 中級者以上向けの機械学習おすすめ書籍
3.1 「機械学習プロフェッショナルシリーズ 」からおすすめする本
機械学習のための連続最適化 (機械学習プロフェッショナルシリーズ) 金森敬文 , 鈴木大慈, 竹内一郎 (著), 佐藤一誠.
- 機械学習向けの連続最適化アルゴリズムについて,入門する,そして深く理解するのに「最適」な本.SDGやその派生アルゴリズムについても,みっちり知ることができる.
- 理論系の研究者陣が書いた本で,初心者向けの優しく直感的に書く配慮は少ないので,(最適化や機械学習理論を専門としない)初心者がいきなり読みこなすのは難しいハードルが高い内容(プロフェッショナルシリーズなので当然).
- 少し惜しいのは,ベイズ最適化や離散最適化が完全無視されていて本書では登場せず,お互いの関連性や,損得・選択を全然学べない点.
- また,Amazonのレビューにもあるように,著者間でNotationが統一されておらず,章をまたぐと読みづらい.また,添え字などのアルファベット割り当ても,応用系の私からすると読みづらい個性的で別業界的な割り当てが散見される.久しぶりに読み返すとそれらのNotationに惑わされるのは,正直めんどうな点.