1.概要
このページでは,サイトの特徴(とそれによる利点)を各節で紹介していきます.以下の「サイトの利点(ウリ)」について,各節で順に紹介します:
- 2節:探求力が上達する「拠点」設計
- 3節:歴史・経緯の重視
- 4節:実用力・ビジネス応用力も重視
- 5節:管理人独自の分析・Tips
2. 探求力が上達する「拠点」設計
このサイトは,移動・検索がなるべくスムーズに日常の習慣となる,中心的な「拠点」となるように設計しています(図1).つまりは,自然に探求的な行動が身に付く・行えることを意識した,サイト(=Webアプリ)構造に設計しています.記事を読んでいて,知らないキーワードや疑問が出てきたら,「他のサイト内記事や,サイト外記事,参考書や元の各論文」に,すぐ移動してそれらも読みたくなる設計にしているつもりです (特に📚用語Wikiの各記事).
※ 2023年6月追記;サイト内の記事数・量が多くなってきたので,「短期間でサイト全部を読破しようとする」のは非効率的であり,やめてください.必要な記事を,必要な時にだけ読む方が好ましいです.
また,豊富で綺麗な「図説」と,クセのある言い回しで,各記事の位置や,文を記憶に残りやすいようにしており,復習や再検索の高さも意識しています.
Referenceも,論文著者名ベースの [Hayashi et al., 2050] という書き方にしています・CVによくある数字ベースの書き方([1],[2]など)と比較すると,著者名と登場年により気を配りやくなり,各研究を印象づけて頭に残し・関連づけやすくなるはずです.
以下の「説明書🔰と活用法💪説明書🔰と活用法💪」もこの記事と一緒にご覧頂くと,サイトのUI・UX設計や,各記事の構造などが知れるはずです.
2.1. Webに相互連携したポータル
親ページ(About | サイトと管理人について)などにも書いているように,私は教科書でもなく動画コースでもなくセミナーでもなく,まずは「無料でWebページ化・ツール化」することにしました(※ 2020年のサイト開設時点での話).その理由は,Webサイトにすると,やはりそのオープン性から,Web上の多くの情報や,論文・書籍とのスムーズな相互連携ができて,使用者目線では非常に便利であるからです(図1を参照).
また,必要な情報が手に入れやすいよう,検索機能や一覧ページを用意するだけでなく,サイトの階層構造を丁寧に設計しています.この「サイト内検索性の高さ・階層的である見通しの良さ」のおかげで,お目当ての内容の記事だけ復習がしやすいはずです.また、当サイト内では情報が足りずとも,豊富なReferenceで,元情報(書籍,論文,外部サイト)にスムーズに移動できるのも,皆様を大きく助けてくれると思います(再度,図1の関係性を参照してみてください).
またWeb検索エンジンで「キーワード検索」してくだされば,スムーズに当サイト内のお目当ての記事に到達することもできます(※ 検索順位向上に,ご協力おねがいします).逆に,このサイトの記事でReferenceを見たり,参考Web記事やお薦め書籍を辿れば,スムーズにサイトの外に出ていき,各関連資料へリーチ・検索し便利に外部も探索することが可能な設計になっています.
授業スライドやWeb動画講義のような,旧来的なシーケンシャルな書籍や論文の階層構造と,このサイトのWiki的構造で探索しやすい階層構造では,果たす役割や効能は違うので,使い分けには注意してください.テキスト・書籍や講義も,(筋にそって順番に学ぶことなど)良い点が当然ながらあり,それらと当サイトの併用がオススメです
2.2 厳選した「指定参考書」との連携
書籍の中でも,以下の厳選した「指定参考書」の各書とは,ページ対応付けや,内容の連携(※ 数式の添え字や,図の色分けの統一など)を行うことで,一緒に読むことで更にこのサイトの使用効果が高まるようにしています(図1).逆に言うと,これらの「指定参考書籍」を当サイトと併用すると,当サイトを使用していない人と,大きく差別化しやすいはずです:
【指定参考書1軍 (特にオススメ)】
中級者以上向けの,2023~2024年発売の最新テキスト3冊です.教える・育てる側である大学教員・中堅研究者層も(電子版でなく物理本)を本棚に加えたいところ.英語教科書2冊は,高価でボリュームも多いゆえ,ほんとに必要な人だけ購入した方が良いです(※ Apple Book版も安くてオススメ):
- Pythonで学ぶ画像認識 (機械学習実践シリーズ) 田村雅人,中村克行 (2023) 【紹介した記事】
- 「Foundations of Computer Vision (2024/4)」 Antonio Torralba , Phillip Isola, William T. Freeman.【紹介記事を執筆予定】
- 「Understanding Deep Learning (2023/12) 」Simon-J.-D.-Prince 著 【紹介記事を執筆予定】
【指定参考書 2軍 (オススメ)】:
- Probabilistic Machine Learning: An Introduction, Kevin Patrick Murphy, 2022.
- 深層学習 改訂第2版(機械学習プロフェッショナルシリーズ) 岡谷貴之 (2022)
- 画像認識とこの本の2冊よりも,今は1軍の英語2冊(Foundation~,Understanding ~)の方が,新しい内容の比重が多くオススメです.
- IT text : 自然言語処理の基礎 岡﨑 直観ら (2022/8月)
- 詳解 3次元点群処理 Pythonによる基礎アルゴリズムの実装, 金崎朝子, 秋月秀一, 千葉直也 (2022)
このように,「CVMLエキスパートガイドの説明」 +「 各テキスト中の(対応づいた)説明」で,2通り以上の説明を同時に読みやすくしているゆえ,相乗的な学習効果を得やすいのが,このサイトの設計です
※ 多くの技術ブログ等でのWeb解説では,テキスト本への参照は用意されていても,本の全体と体系的に連携できてはいません.
それは,2.3.2節の「元論文」や,「外部リンク先記事」についても同じであり,1つの内容について,複数のリソースを一緒に読むことが肝心です.
2.2.1 「Pythonで学ぶ画像認識 (機械学習実践シリーズ) 」との強い連携
上記「指定参考書」リストの中でも,とりわけ,Pythonで学ぶ画像認識 (機械学習実践シリーズ) と,このサイトの各記事は,強く連携をしており,一緒に使用すると効果が高まることが期待できます.
※ 説明書🔰ページの2.3.1 節「参考書籍」にも,指定参考書書籍一覧あり.
本書は,画像認識の基本的なPythonでの実装を,理論解説つきで学べる,中級者からその面倒をみる上級書・管理社層に適した良い書籍です.とりわけ以下の2つの理由から,つよい相互連携が産まれることになりました:
- この本が発売される前に,CVMLエキスパートガイドが既に公開していた各記事が,うまいことをPythonで学ぶ画像認識と親和性が高くなっていた.
- 第2著者の中村さんは,以前からよく話す同世代の旧知の仲で,SSII(2018~2020)においてオーガナイズドセッションの運営活動を一緒に行ってきたので,業界貢献の動機もお互い近い.よって,本書発売後に,連携性を快くうけいれてくださる結果につながった.
ともに中級者層をターゲットに,「理論と実践」のほどよいバランスを目指した構成ですが, (1) 理論解説が詳しいめのCVMLエキスパートガイドと,(2)実践解説詳しいめのPythonで学ぶ画像認識 は,連携性が高いと思います.
3 歴史・経緯の重視
既に何度も述べているように,サイトの内容は,ディープラーニング界隈の,近年の画像認識や機械学習の研究・技術の「知識・知恵」両面での向上を目的とした構成・設計のサイトにしています.
一方で,コンピュータビジョンや画像処理の古典的な技術の紹介も私はこのサイトでも大切にしています.ディープラーニングに手段が変わっても,多くの「昔から取り組まれているパターン認識系の問題」は,本質的な所があまり変わっていないものも多いと考えます.従って,管理人は「古典的技術」や「歴史的な変遷」も非常に大事にしています.
※ 逆に言うと,コンピュータビジョンは,代表的な画像認識や画像生成タスクの「精度」だけは向上してながらも,取組む問題はそう変わっておらず,あまり進化・拡大できていない側面も強い分野の1つだとも思います.
各記事では,その技術やテーマの歴史・経緯も記述して,年表的に頭に整理されて入っていきやすいように,各用語記事内のローカル記事構成を重視しています.各技術の流れを知ったり,普段からその癖をつけて考えるようになることで,研究開発が知的で面白い活動となることや,歴史的な経緯の理解に深い研究者を増やすことを狙います.
その意味でこのサイトは,記事数と各記事内の充実にともなって,「歴史年表アプリ」としての機能も,自然と備えていくはずです.私は,かつて学んだり使っていた「深層学習流行以前の古い技術」の紹介も行えるので,それらを紹介するだけでなく,現代の技術との関連付けすることも重視しています.(例:古典的な単一クラス物体検出 や,「空間フィルタリングと畳み込み層の関連付け」など)
世の中のテキストやWeb記事は,ディープラーニング以前の技術を無視して,いきなりディープラーニングの技術だけ説明して,それ以前からの流れや「なぜその技術構成になったのか」がわからない資料や書籍」が,多くを占めます.それを,このサイトでは,ディープラーニング以前の技術からきちんと紹介することで,新旧比較して今の技術を説明することも力を入れています.
(2025年03月追記)About | サイトと管理人について の1.2節「このサイトの概要」にも追記したように,私のクリエイター重視・リスペクト姿勢により,当サイトでは(事前学習が無許諾・著作権侵害的である)大規模AIの話を嫌って、解説記事もそれらをなるべく避けています.よって,2021年以降のそれらの「商用化された大規模AIの話(=歴史)が当サイトには書かれていないことには注意してください (それ以前の研究段階の中規模モデルであれば、生成AIには少し触れています)。
4. 応用技術力,ビジネス応用力も重視
このサイトがターゲットとする「中級者以上の方々」の多くに普段の仕事で必要なものとして,「ビジネス応用力」の高さも挙げられます.それは,社会・人間の需要やニーズに寄り添って,実用的に動くサービス・システムを作る能力です.
せっかく高い技術をもっていようが,実用力がないと,よい製品として市場で受け入れられることができません.昨今は,データサイエンス界隈でも,単に機械学習に長けているだけでなくて「ビジネススキル」も必要であることが叫ばれています(コロナで仕事の絶対数が減ったのもあるでしょうが).たとえば,客単価や,ビジネスターゲットを絞ることができますか?競合他社と似た技術ばかりで打つ手なしになったりしませんか?研究者の方も,出口が見えさすぎる分野に固執してるあまり,応用研究をやっているつもりなのに10年以上もまとな製品が売れていない技術分野を続けてしまったりいませんか?
これまでのオープンソースに加えて,クラウド向けAPIも充実してきて,物体認識や物体検出などをはじめコンピュータビジョンのコモディティ化は進んできています.ハイレベルな技術に取組んでいるつもりでも,結局同じような類似タスクに取組んでおり,つまりは各社似た技術ばかりで戦っています.そうなると,単に技術力が高いだけでは製品やサービスは売れません.
また,製造業が優位な日本では,狭い業界にたくさんの競合他社が存在しすぎて,今後の成長があまり望めない分野もあります.もちろん,どの仕事も社会的には必要なのですが,あなたがビジネスセンスや業界知識に疎ければ,市場がなかったり,既に市場が飽和しているのもわからず「技術力だけ高ければどうにかなる」と勘違いし,長年勝てない無駄な戦を続けている可能性も高いです.そうした,「俯瞰力や先見性のない下手な失敗(=習ったことを丸暗記して従ってるだけ)」に陥らないためには,歴史や先人の仕事に注意を払って学ぶ姿勢(もしくは学ばない or 古い考え方をアンラーンする姿勢)も,非常に重要と考えています.
5. 管理人の独自の分析・Tips
各記事には,管理人の独自の解釈・階層的な整理も織り交ぜています.
ここで初めて知ることになった「そういうシンプルな話だったのか!」とハッとするような解釈もたまにあると思います.
実用性・応用を重視するので,「各道具の使い方だけ書いてあるけど,じゃあどうやってそれを組み合わせていつ使うの?」とならないように,各タスクの記事(例:物体検出・セグメンテーションなど)の充実も通して,「いつどの部品・道具を,どのように実際には組み合わせて問題を解くか」を,読者も常に自分で考える癖がつくような,記事内容・サイト構成を意識しています.
※ 素人が「個別の工具の説明動画」だけを見せられても,家を最後まで建てられない.
このサイトでは,各記事の文章説明内だけでなく,「(1) 図の構成」や「(2)記事間のリンク」「(3) 記事全体の階層的カテゴリー構造」の3点についても,こだわって各記事を作成しています.これらの3点をとおしても,「これまでなかった,分かりやすい新解釈」を提供していきたいです.それにより,みなさまの気づきや理解度の向上に繋がって頂けると,このサイトで 私なりの体系化・作図・既存技術の再キュレーションを,提供している価値が高くなるということでもあります.
特に,(1)の「図の作図」に関しては「私の方で,独自にイラレで描いた綺麗な図」を作成しており,(文だけでなく)図によっても,私なりの視点や解釈もあらたに与えることで,皆さまのお役に立ちたいです.(論文を書くときと同じように,各記事の図1は、非常に気合いを入れて描いています)
言い換えると,これら3点には,私独自の新規の説明や解釈が含まれている場合もあります.従って,これら3点に,「自分は知らなかった,気づいていなかった新しい視点や解釈が得られるかも?」と気を配ってサイトを利用していただけると,サイトの利用効果が高くなると思います.
※ 元の論文や他の解説記事・テキストでは見たことがない「このサイトで初めて知った解釈・分析・文章説明方法・図での解説」については,出元が私の記事であることを,きちんと言及して引用して頂けると助かります.無料でサイトを提供してはいますが,無断盗用したり,あたかも自分の考えた解釈や分析のように見せることだけはご勘弁いただきたい.私も参考にした引用元のページのリンクや,作図の参考にしたインスパイア元の図は,必ずreferするように気を配っています.