サイトと管理人について

1. サイトの概要ときっかけ・動機

CVMLエキスパートガイドは,コンピュータビジョン(Computer Vision, CV)と機械学習(Machine Learning, ML)を中心テーマとした「ガイドマップ型構造の学習支援サイト」である.プロの研究開発者である中級者層をターゲットに,研究に取り組む際の探究能力の向上や,日々の探索的・思索的な生活の向上をサポートする目的で,[用語集 📚 × 2. コラム💡]の2カテゴリのサイト構造にしている(1.1節)

また,本サイトを拠点サイト,帰艦基地として日常的にブラウザ上に開いて活用していただくことで,皆様の日々の探究的な研究生活を,より充実したものにしていただきたい.

そのような,皆様の個人の才能を更に伸ばすためのガイドサイトを私の方で提供することで,皆様を長期的にご支援するのが本サイトの狙いである.

1.1 主要な2コンテンツ

サイトの構築・記事執筆・管理人は,コンピュータビジョンを専門とするMasaki Hayashi (研究者個人ページ)がおこなっている.私は,研究ディレクター・および企業の研究コーチ業を仕事としている,

日常の研究開発(=旅)における探究活動を「もっと楽しい旅にするガイド」として,本サイトを旅行時にに小脇に挟んでいる感覚で活用していただけると嬉しい.

このサイトは,以下の2つの主コンテンツ「用語集コラム」の記事群を通して,コンピュータビジョンやその周辺技術の専門家である皆様の,「求的な活動」を日常的にサポートする

  • 用語集 📚 :知識獲得・探索拠点の提供 (ガイド地図=Wiki教科書を融合)
    • [全体(global)] 技術間の関連性を重視した用語解説ページ群のWiki
    • [各記事(local)] 教科書レベルの日本語解説を構造的な記事で提供
    • わかりやすい図」も,各記事で提供.
  • コラム 💡:知恵行動の向上方法の提供」(ノウハウ・コーチ・哲学形成など)
    • 行う・考える・議論する力の向上を重視した,コラム記事群の提供.
    • 研究論文の探索方法(検索キーワード)や,サーベイやアイデア出しの方法.
    • 手段・思考能力向上を支援:行動の仕方や,疑問の持ち所(Q&A)など
    • 独自性の確保方法取得を支援:自分で深く考える・比較方法(Q&A)など

これら2つのコンテンツを,日常的に使用・探索・復習しながら,研究開発していただくことで,読者の皆様の実力が,自然と向上していく事をねらっている.

とりわけ,技術間の関連性を,サイト全体の構造を通して自然と皆様に提供することで,旅行ガイド本や,趣味・スポーツ別の攻略本のように学習・復習や,研究のアイデア出しの能力向上を助ける.それにより,日本の中間層全体のパワーアップの実現が,本サイトの1番狙いである(2節).

また「3. おすすめ書籍」「4. ソフトウェア」の各カテゴリでも,役に立つ情報を,集約・整理して提供しています.

1.2. 著作権について

以降では詳細を述べていくが,最初に一番大事な著作権について書いておきたい:

本サイトの全ての内容,記事中のテキストおよび(自作した)画像の著作権は,全て著者である私,Masaki Hayashi に帰属するものとする.

1.3 「用語集 + コラム」 の構成にした理由

1.3.1 用語集 → 日常使用で「Wiki × テキスト」

CVMLエキスパートガイドとあるように,1.「用語集」を中心に,旅行ガイド本・旅行案内人のように,技術間の関連性Wiki形式で,地図のように構造的に提供し,なおかつ教科書・テキストのような簡潔な用語記事をとおして,市販のテキスト相当の標準的内容を学べるようにしてある.つまり「用語集」では,Web上の無料Wiki型教科書の構築をしている.

Web上で構造化するということは,すなわち皆様の効率的な学習・復習や,研究のアイデア出しを「探索化」「検索化」できることも意味する.また,記事で参照している各元論文・テキストをこのサイトと合わせて読んでいただくことで,標準的な知識の徹底的な強化・復習を行いやすいサイト構造を意識してしている.ただ,それをWeb上で構造化させてある点が,書籍や他サイトとの大きな違いである.

Murphy 氏のMLaPP の愛用者であった私は,MLaPP や その2022年の 続編が達成している「必要最小限の標準レベルの技術のみを,簡潔にわかりやすく厳選して順になぞっていく」という設計思想を,私もこのサイトで達成しようとしている(ただしテキスト構造ではなくWebサイト構造で).

しかし,市販の多くのテキストのように,基本技術の概要だけを羅列してなんとか圧縮して1冊の本にしただけでは深い学習が行いづらいとおもっている.もちろん上級者レベルになってくれば中級になりたての方々だと,まだまだ上級者の洗練された知識・経験や.Web上には浅い概要の記事しかない.他の多くの細分化した分野と同じで,我々が思っている以上に,皆様のレベルは上がっており,以前より深い内容を欲していると私は感じている.

各技術の原理や関係性がわからず,実際の使い方もイメージが沸かないのようでは,単にAPIを叩いているのと変わらず,応用も効かない.そもそも,現代のパターン認識の大半は応用である.ということは「使って役立ってナンボ」である.基礎や理論に詳しいだけで,応用(あるいはタスク)に弱い人だと,道具だけ知っていても,現場でうまく応用できない.現場経験や,アカデミック側だとしても実応用経験が豊富でないと,成功・失敗例も知らないままだし,第一に,「何の問題を手につけるべきか」がまず判断できない(特にビジネスでは,利益につながらない研究ばかりにフォーカスする結果にもなるのが勿体ない).

(※ 2022年8月追記) 私のCVMLエキスパートガイドは,既に提案後の改善が一通り終わった,現在より最低でも3~5年以上前に提案された内容が中心である.つまりは「教科書に載せるべきような,標準的に使われるようになっている最も重要な技術=標準的技術」のみにフォーカスをあてている.鮮度の良い最先端の研究については,まだ良いか悪いか,使えるか使えないか確定的でない事も多いゆえ,このサイトではあまり深入りしない.その未確定フェーズを経て,生き残った「数年経ち安定してきた標準的技術」の徹底とした習熟を,このサイトを通じて私が皆様に提供できることの,最優先事項としたい.

1.3.2 コラム → 自分で探し,考え,疑問を発見し,応用する力を伸ばす

そこで,2.「コラム」を通して,中級者が必要な標準的な考え方やノウハウ,思考法や研究戦術など,要するに,プロを目指す脱初心者~中級者くらいの方や,プロの中でも中級者向けのガイドムックのようなものに相当している.実応用での勘所や,各タスクごとの記事(=応用の仕方) の提供も重視することで,どう使うかどう分析するかなどの「各知識の関係をもとに,どう実際に使うか・考えるか」の,知恵・ノウハウの向上も,大切にしたい.

「用語集」だけで終わらず,「コラム」も提供している理由はここにある.知識より知恵や思考法の方が高度であり,言語化もしづらい高価値のものであると思う.よって,コラムも提供することで「知恵」「メソッド」面も大切にしたい (2.3でも述べるが,用語集でも,自然と思考力が向上したり,ノウハウを提供するような内容にはしてある).

古典的な技術も重視

このサイトでは深層学習流行以降の技術を中心的に取り上げている,ただし,それ以前の古典的な技術も大事にしている.また,本サイトを,「情報源のハブ」や「テキスト兼Wiki 代わり」として,日常的に利用して頂くことにより,皆様の日々の探究活動が,探究的・思索的になり,自由で楽しい旅へと変わることも狙っている.皆様の横に,「旅の案内人」と「ガイドムック」が味方している感覚で使用していただくと,日々の研究が探索的(知識・情報収集能力の向上),また思考的・思索的(知恵・アイデア創出の向上)なものとなり,更に充実した成果が出せるようになるはずである.

1.4 管理人の一貫した狙い

管理人の詳しい経歴や動機については,以下の子ページに別途まとめてある:

この子ページに書いたような,経歴・背景を持つ私は,(1) 博士号取得 (2) 博士後の中堅の研究チームのディレクター,(3)企業の研究開発のコンサルティングの仕事,(4) 起業時からのベンチャービジネスの経営層,などを経験してきた

そういった多用な経験や成果(失敗も含めて)も持つ自分だからこそ可能な, 教科書・テキストにまとめるような,抽象度の高いコンピュータビジョンの標準的技術の紹介(主に用語集)と,研究における探究手段やノウハウの能力向上(主にコラム)に,このサイトでは注力したいと考える.また,それに続く書籍などの執筆・起業へのコーチング活動・授業動画の提供として集中したいと考えている.

逆に,PyTorch・Tensforflowなど,DeepLearningフレームワークの使い方や実装については,テキスト書籍も多いので,そちらに任せることにして多くは書かない.基本的なコーディングや,技術の要約の列挙や修士卒レベルの方々でもできることだからである.中堅以上のキャリアがある私だからこそできる,俯瞰度も抽象度も高い「アカデミックな話」と「ビジネスな話」の提供に集中したい.

関連記事:主要なDeep Learning ライブラリ・フレームワークの一覧

1.4.1 著者のターゲット「中間層の充実」

昔から一貫している,私のコンピュータビジョン業界への達成目標は『日本の中間層の充実(プロ,アマ限らず)』である.「中間層を分厚くして,主人公を増やすこと」が,私の一貫した狙いである.もちろん,私もまだまだ学んだり,経験しないとならないことが多いゆえ,皆さまと一緒に更に成長できれば幸いである.

サイト構築における動機「中間層の充実」については,以下の記事にまとめている:

1.4.2 気軽に質問・お声掛けをどうぞ

Twitterでも,サイトの感想や,研究生活に関する疑問などについては,Twitter上などで気軽に話しかけていただければ幸いである.問い合わせフォームからご連絡いただくのも歓迎である.

今後はサポート業を中心にはしたいが,(2021以降も)たまには論文も発表するつもりなので,学会発表した際には,ご意見ご感想いただけると嬉しい.

あと,関連する研究をされている方は,最近の私が著者になっている研究への引用も検討していただけると嬉しい.

2. サイトの詳細

2.1 エキスパート向けの「ガイド」とは?

サイト名に「エキスパート(向け)ガイド」と入れてある通り,このサイトは,ガイドマップ(地図) のような構造・構成を意識している.たとえば,観光地に持っていく「るるぶ」や「地球の歩き方」のような役割や,現地ガイドやバスガイドみたな役割を目指している.つまりは, 読者が旅の主役となって,楽しく目的もある旅を続けるためのガイド本・観光ガイド」を提供したいのが管理人の動機である.よって,ただ単に,読者の成長をご支援するだけでなく,毎日のみなさまの研究開発活動が「面白く・より探究的になる」ことも狙っている.

サイトの内容は,ディープラーニング界隈の,近年の画像認識や機械学習の研究・技術の「知識知恵」両面での向上を目的とした構成である.一方で,CVや画像処理の古典的な技術の紹介も大切にしている.ディープラーニングに手段が変わっても,多くの「昔から取り組まれているパターン認識系の問題」は,本質的な所があまり変わっていないものも多い.よって,管理人は「古典的技術」や「歴史的な変遷」も非常に大事にしている(逆に言うと,コンピュータビジョンは精度だけ上がって,やることは変わっておらず,あまり進化・拡大できていない分野だとと思っている).

このサイトがターゲットとする中級者の方々に必要となるものとして,「ビジネス応用力=社会・人間に寄り添ったサービス・システムを作る能力」の高さが挙げられる.社会応用力にも強い人材になっていくには,これまでの過去の応用の知見を蓄えて活かす能力が不可欠であるので,歴史や先人の仕事に注意を払って学ぶ(もしくは学ばない!)姿勢も非常に重要である.

以上より「用語集」においては,グローバルなサイト全体や親記事同士のレベルでは,地図や年表(歴史)として全体図を俯瞰できるようにし,ローカルな各子記事レベルでは,教科書・テキスト書籍のように,各用語の詳細と関係性を紹介する

つまりは,全体(Wiki構造と記事間・単語間のハイパーリンク)局所(各記事の,テキストレベルでの解説や図説)の,両方の質の高さに気を配った用語集にしている(次の2.2節).

ぜひ,一人でも多くの方が,このガイドマップ型サイトを有効活用して,レベルアップしていただき,新たな主役として業界で活躍して頂くことを願ってやまない (このサイトは,その一番下で働いて後押しする,下支えとしての高速な車輪でありたい).

2.2 歴史・経緯の重視

各記事では,その技術やテーマの歴史経緯も記述して,年表的に頭に整理されて入っていきやすい「各用語記事の記事構成」も重視している.各技術の流れを知ったり,普段からその癖をつけて考えるようになることで,研究開発が,知的で面白い活動となることや,歴史的な経緯の理解に深い研究者を増やすことを狙っていきたい.

その意味でこのサイトは「歴史年表アプリ」としての機能も,備えていく予定である(記事が増えて充実していくほど,その機能が増していくはず).著者は中堅研究者なので,かつて学んだり使っていた「深層学習流行以前の古い技術」の紹介も行えるので,それらを紹介するだけでなく,現代の技術との関連付けすることも,このサイトでは重視する.

2.3 管理人の独自の分析

また,管理人の独自の解釈・階層的な整理も織り交ぜてある.ここで初めて知ることになった「そういうシンプルな話だったのか!」とハッとするような解釈もたまにあると思う.応用を重視するので,「各道具の使い方だけ書いてあるけど,じゃあどうやってそれを組み合わせていつ使うの?」とならないように,各タスクの記事(例:物体検出・セグメンテーションなど)の充実も通して,「いつどの部品・道具を,どのように実際には組み合わせて問題を解くか」を,読者も常に考える癖がつくような記事内容・サイト構成を意識している(※ 工具の説明動画を個別に見せられても,素人はそれだけでは家を最後まで建てられない).

各記事の文章説明内だけでなく,「図(の構成)」や「記事間のリンク」「記事全体の階層的カテゴリー構造」の3点についてもこだわっている.これら3点をとおしても,「これまでなかった,分かりやすい新解釈」を提供していきたい.

言い換えると,それら3点にも私独自の新規の説明や解釈が含まれている場合もあるということである.管理人がこだわって作成している.この3点に,新しい視点があるかを気を配っていただけると,気づきがあると思う.

※ 元の論文や他の解説記事・テキストでは見たことがない「このサイトで初めて知った解釈・分析説明方法」については,出元が私の記事であることを,きちんと言及して引用していただけれると助かる.無料でサイトを提供してはいるが,無断盗用したり,あたかも自分の考えた解釈や分析のように見せることだけはご勘弁いただきたい.逆に,私も参考にした引用元のページのリンクや,作図の参考にしたインスパイア元の図については,かならず参照するように気を配っている.

また,「コラム」記事にかぎらず,「用語記事」中にも 管理人の考え方や発想法を,記事中に,ちょくちょく挟むようにしている.知識習得も大事であるが,同時に「手段」や「方法」の実力を伸ばすことも,非常に大事だと考えるからである.

例えば用語記事の1つを読んで,「説明がわかりやすかった」と思ったからといって,内容をそのまま鵜呑みにしてしまうのは良くない.自分では何も考えずに,意味もわからず考えずに身に付けた「表面的な知識」ほど,付け焼き刃で使えないものはない(場合によっては,発信者の知名度や表面に騙される).成長していくには,何事にもまず疑問を持って,込められている「意味」や「意図」を考えられるようになるのが,応用力を伸ばし成長して上で大事である.

ぜひ,このサイトの各記事も,丸暗記したり鵜呑みするのではく「どういうことかな?」「なぜかな?」と常に考えながら生活する癖をつけていただきたい.そのために用意しているのが「コラム」でもある.「用語集」だけのサイト構成だと,考える癖がつかないまま育つ危険性があるので、考え方や行動方法を主眼とした「コラム」を用意している.

3. サイトの「目的 」とその背景

3.1 狙っている構成

CVMLエキスパートガイドでは,総合的なガイドマップとして教科書的な情報を集約しておき,ユーザーの方々が,日常的に便利に利用できる「情報集約サイト」構築を通して「(専門が近い)研究開発者の方々への,学習および研究活動の支援」を行うことを目的としている.そして,「エキスパートガイド」と銘打っているように,「広く中間層全体の,コンピュータビジョン・ディープラーニングを専門とする方々に」,その支援を行うイメージである.

概要(1.3節)でも述べたとおり,以下の子記事に「中間層の充実」という目的・動機については詳しく述べてある:

子記事:サイトの動機とターゲット: 中間層の充実

この動機を達成するために,このサイトでは,読者の「学習・分析・整理(入力」と「アイデア出しや成果物の洗練(出力)」の2面について,強力に支援することを特に狙っている.よって,「知識(用語集)と知恵(コラム記事)」の双方を向上させやすい構成でサイトを提供している.

ここからは,その目的を達成するために,「用語集の機能(3.1.1)」や「用語集の階層構造(3.1.2)」「コラムの設置の意味(3.1.3)」で,それぞれ何を狙っているかについて述べていく.

3.1.1 用語集の主機能:「Wiki型ガイドマップ」

用語集は,「観光地ガイドマップ」のような役割・機能を意識して設計した.旅行ガイドブック程度の簡潔さを持ちつつも,名所(押さえておきたい標準的な内容)の網羅をおこなっていく.つまりは,このサイトの各記事が標準的技術深読み・簡潔な整理記事となっており,なおかつ,それら名所となる用語・項目同士の関連づけの地図ともなっている.日常的に繰り返し使用していただければ,関連性が,階層的・グラフ的サイト構造を通して自然と身につくことが,用語集で最も狙っている点である.

3.1.2 用語集の階層構造

論文や専門書それぞれにリーチする前にも「この技術やこの論文だけは最低限,プロなら押さえておきましょう」という標準的内容を,本サイト内だけで辿れる知識集約サイト外部情報へのハブサイトを構築したい.

用語集を日常的に使用して頂くと,「(1) 繰り返し各ページを読みなおし」,なおかつ「(2)各ページに紐付く元論文や,外部サイトやテキストを復習すればする」ことになる.すると,体系的な知識として,(local)ページ内での階層構造・関係性と,各ページ間の全体(global)の階層構造・関係性が,脳内に自然と染み付いていくはずである.

用語集はWiki構造なので,検索も遷移もしやすいゆえ,探索的な学習の習慣も自然と見につく.「読者にとって重要な情報」にも,うまくたどり着きやすいはずである.また,コラムを同時にうまく活用して頂くと,なおさらその関係性への理解や疑問が,強化されると思う.

3.2 「自分の軸」を育るために:標準的技術の習得を支援.

あくまでガイドマップなので,研究のスピードアップと効率化や辞書目的にだけ使っていただきたいとも思う.教科書テキストのように,このサイト全部をきちんと読み通していただくことは意図していない

また,2次情報だけに頼ることは良くないので,「このサイトの用語記事だけを読んで終わり」は,なるべく避けてもらいたい.1次情報である論文自体をきちんと自分で読むだけでなく,自分で論文を書いたり,実験したり,周りの同僚と議論したり,実際に業務で研究を行ったりする中で,必ずご自身の頭と体を使って技術を身につけて頂きたい.そして,自分の軸と方向性を大切にしつつもこれまでの常識や枠をはみ出すことも心がけていただきたい.

管理人としては,みなさんが「自分がどうありたいか」,「自分が何を狙っているか」を自分自身で育てていき,それを確立していくことが非常に大事であると考える.その「自分の強い軸(探究の独自方向性)」を,皆様が育てるための強力な支援を行えれば幸いである.

3.2.1 もちろん基礎の習得は大事だが…

私が,他人を指導させていただく際の方針は「基礎の定着はすっ飛ばして,即実践に入ることが大事」というものである.研究をはじめたてのころや,中級者になりたての頃は,まず自分で研究のプロセスを一通り踏むことがなにより大事と考えており「習うより慣れろ」の方針がよいと考える.それが,中級の中でもスキルが上がっていくと,より抽象度が高いまま,思考レベルでのみの仕事がこなせるようになっていくはずである.

プロになるまでに,標準的技術は,徐々に習得していけばよい.なぜなら初級~中級なりかけでは,知識の本質をつかんだり,型の意味を咀嚼することは,(プロにまだなっていない時点で)どうせ深く本質的に理解できていないからである.中堅の私でも,基礎力や標準的技術の習得は,まだまだ足りていないはずであり,今後も精進する状況が続くのである(※ 機械学習業界は,移り変わりが一年単位で速くなっているのも理由).

先に実践なく基礎だけ積み上げる作戦は,よほど時間が豊富にあって余裕がある人や,トップ研究者なら取ってもよい戦略だとは思う.しかし,一般的な人にとっては,先に全ての基礎や標準技術の習得をを完璧にこなしておくのは,時間的に不可能である(そもそも今のコンピュータサイエンスは,学ぶべき基本事項が膨大すぎるので,その対抗策の1つとして,このサイトを立ち上げた側面もある).

よって,学習内容が膨大なCVML関連やその界隈の分野の皆様が,基礎の網羅的な習得はいったん脇に置いて,まずはアウトプット重視で突き進む一助にこのサイトが少しでも貢献できれば,業界全体の中間層充実の加速につながる.

あなたが優秀で,学生の頃からトップ成果を出している層でないかぎり,間違っても若手の頃から「このサイトに載っているような標準技術は,全部よく知っておこう」としていくのは,オススメしない.今のディープラーニング界隈は,膨大な全ての情報を追うのは無理なので,その方針は基本的には誤りである.現代は,「自分にとって」重要な情報にだけ探索的にフォーカスを当てるのが基本的には正しい作戦である.その探索的・検索的な活動を支援する情報ハブ兼テキストとして「用語集」を提供している.ぜひ,用語集は,探索的に使うことをまずは基本にしていただきたい.

また「コラム」では,論文の検索法や読み方記事なども提供するゆえ,そもそも「どのように探索するとよいか」の手段の話も提供する.これにより,このサイトの外でも,どのように検索や探索およびサーベイを行って,それを良質な出力に結び付けるかの「知恵・手段」の向上の話も展開していきたい.また,将来的には,その際に問われる,「批評力」や「分析力」に,同僚や査読者との「議論力」「対話力」の話も提供できるとうれしい.ただ,いきなりは全部はできないので,まずは用語集の充実を優先している.

4. 記事のカテゴリー分類

このサイトは「10年後もあまり情報の価値が廃れることのなく、かつ大学教員が提供するような専門性の高い教科書的な情報の提供」にフォーカスしたい.そもそも,将来的には教科書・テキストを書いたり,Webで動画コースも提供していきたいのであるが,まず情報の関連性や集約性を一番良くできるのはWebページであると,サイト開設時に感じていた.従って,最初はこのWebサイトから提供を始め,十分に記事数が溜まってサイトの質がよくなってきて以降,書籍や動画講義に,Youtubeなどを公開していく手順とした.

これらの,学習支援環境の構築活動に対して,スポンサー支援などで,強くご支援いただける企業などがいらしたら,お声がけして頂けると嬉しい.

4.1 記事の分類一覧

1節冒頭で,用語集とコラムの概要はリスト化して既に見せた.

ここでは,もう少し詳しく各カテゴリーの内容と狙いを,以下に列挙して整理しておく.

  • 用語集 (全記事リスト) [ for 知識の向上 ]:
    • コンピュータビジョンと機械学習・画像認識における専門用語の記事を増やしていき,本サイト内で階層的Wiki化を行う.
    • 記事中で紹介した用語が紹介されているWikipediaページ・書籍・論文も記事に関連情報として添えて,詳しいところはあくまで自学してもらうようにしたい.
    • 各用語記事は「テキスト・教科書」と同じように,詳しいながらも簡潔な内容を目指したい.そして,詳細さよりも,私が持ってる独自の視点・経験を少し盛り込むことを重視している.
  • コラム記事[ for 知恵 の向上]:
    • Q & A記事 (2021年6月スタート):
      • 英語圏では Quora や Reddit のようなところで,互助的に高度な意見交換や議論が活発に行われている.一方で,日本ではオープンなWeb上では,技術の深い議論やQ&Aが交わされる場所が形成できていない.
      • とりあえず私個人でこのサイトで「疑問」や「問い」を考えて,それに自分で答えるQ&A記事を,細々と書いていくことにした.双方向的ではなく,プロの私が,初心者向けの勘所をQ&Aとして列挙している感じではあるが,参考にはなると思う.
    • CVML論文の検索法(2021年11月スタート):
      • 論文を検索する際には,論文のタイトルにあるパターンを若い頃から知っていると便利なのだが,なかなかそれを教えてくれる人もおらず,パターンをまとめてくれている書籍などはない.
      • そこで,CV分野に限るものの,論文のタイトルや内容の典型パターンを「検索キーワード」として,たまに紹介していくこととした.
  • ソフトウェア(2021年6月スタート):
    • 以前はOpenCVかMatlabあたりに詳しいことが,CV分野の研究・開発者には大事であった.
    • それが,近年は PyTorch や Tensorflow などのディープラーニング向けライブラリに習熟する必要があり,それぞれの違いや使用法を把握しておくことが重要である .ただし,各ライブラリのチュートリアルや細かい話までは,書籍やWebコースも多く,任せられる.
    • よって,本サイトは,主要ライブラリの概要とリスト化のみおこなう.各ライブラリの基本情報を簡潔におさえられることだけをしておきたい
  • おすすめ書籍
    • 大学院生向けの教科書や,研究者向け専門書を厳選したものを紹介する.
    • 用語記事数が100を超えて,このサイトが充実してきたら,研究者や管理職としての働き方を学ぶためのおすすめ書籍も紹介していきたい.(ライティング術や,計画スケジューリング系の書籍,コーチングテクニック,思考法・アイデア術の本など).
  • 検索専用ページ(2022年3月スタート):記事数の増加に伴い,カテゴリーやタグで記事を検索する専用ページを設置:

5. CVとMLにフォーカスする理由

管理人は「画像認識・コンピュータビジョン全般」(CV)と「機械学習・深層学習(の特に実応用)」(ML)を,主な研究興味とし,なおかつビジネス専門分野としてている(特に動画認識が得意なので,それに関連した仕事の依頼が昔から多い).よって,素直にそれらのCVとMLを主テーマとするサイト構成にした.「CVML」という組み合わせについては,ブログの「機械学習とかコンピュータビジョンとか」さんのタイトルにならって,この組み合わせを選んだ.

5.1 動機

以前から,ビジョン系および深層学習・機械学習周辺の研究コミュニティでは,身につけておきたい基礎的な内容が膨大であって,非常に辛いという問題を抱えている.それら基礎教養の全てを知る必要は必ずしもない.しかし,ビジョン系の学会では細分化されて学会が開催はされず,それらの全ての内容が1つのコンピュータビジョン会議に集結する.よって,各項目について知っておいた方が見聞は広まるしアイデアも出てくるし,広くアンテナが張れるようになれば,「あの人の技術や研究能力を頼りたい」と思うことも出てきて,その人に共同研究や共同開発をお願いしに行きやすくもなる.(もちろん,そんな中でも広く知ることをやめて,深く狭く攻めるのも戦略ではある).

深層学習ブーム以降,その「浅くても良いので知っておく方がよい基礎知識量」の雪だるま的な膨大化が,更に加速していると感じる.深層学習は,その「モジュール結合の容易性」により,マルチモーダルやマルチタスク学習の容易さも増した.しかし,それは近隣分野との融合研究の増加にもつながった.そのせいで,各分野間の境界領域では問題設定が混ざったり,過去の2分野以上の問題を合わせて解くことも多い(Vision and Language や text2speech など).更に,どの問題に対しても強いモデルであるTransformerの登場で,以前より更にパターン認識系の各分野間の垣根がなくなりつつある.

そうした中で,コンピュータビジョンと深層学習時代の標準的内容をこのサイトで日本語でWiki的構造として提供し,なおかつ重要な標準技術項目のみについて深く学べて検索もできるガイドマップを提供できれば,今後,長期的に20年~30年皆様に役に立つサイトを構築していけるはずだと考えた.これが,本サイトをCV,MLをターゲットに立ち上げた理由である.

授業スライドやWeb動画講義のような,旧来的なシーケンシャルな書籍的階層構造と,このサイトのWiki的構造で探索しやすい階層構造では,果たす役割や効能は違うので,使い分けには注意されたい.テキスト・書籍や講義も,良いところが当然あり,それらとこのサイトの併用がオススメである

また,WikipediaなどのWiki構造辞書サイトと同じく,本や授業と異なり,用意に新しい記事を追加していける上に,公開済み記事もどんどん動的に更新できるという「成長・拡大・リライトできる強み」を持つ.動画講座や書籍は,版を重ねるまで固定化してしまうし,各情報に絞って高速な検索はしづらい.また,みなさまが所持しているテキストのように,本にしてしまうと,各項目はWikipediaほど深く掘り下げた記事にはできず,圧縮されたものの列挙になりがちである.

5.2『日本語で』良質な記事を届けたい.

かつて「コンピュータビジョンのセカイ」をマイナビ様に連載提案をした頃から,私の一貫しているコンピュータビジョン情報発信の動機がある.それは「英語圏のWebでは大量にコンピュータサイエンスの情報があるが,日本語にはそういった情報源が少ない」という動機である.(既に削除した)前身のブログ「DERiVEコンピュータビジョンブログ」も,同じ動機であった(ただ,当時の私は未熟であったたので,今ほど高レベルの内容を提供できなかったが).

コンピュータサイエンスにおいて,すっかり米国の次の2番手になった中国圏でも,現在では知乎(zhihu)などのサイトを中心に,洗練された情報が中国語で大量に出回っている.そうした中,日本語での情報提供は皆様にもぜひ頑張っていただきたいので,そう主張するのであればまず自らも行動で示していきたいというのが,このサイトを開設した理由の1つでもある.

知能的・機械的なタスクを人間以外に任せることが加速的に進んでいる現在,(それでも)働きたい人にとって大事なのは,「入力(分析力・破棄力)」と「出力(創造力・設計力)」の質であると思う.良いものを取り入れて,そこから良いものを出せることができるのが次世代のプロフェッショナルであると考える.

そのために,情報の大海に溺れずに,自分自身に特有の探求先に強くフォーカスできるように,ぜひ,このガイドマップとしてこのサイトを長く有効活用していただきたい.当然ながら,(短い時間でも良いので),自分自身でWebで発信して,出力も積極的に行っていくことが大切であることも付け加えておく.このサイトは,授業的な「私→みなさん」単一方向的ではなく,Wikiやコラム群など,探索的で能動的に自分の興味に従って自分で探索して頂く,「探究活動の拠点基地」としてお役に立てることを意識して設計した.

最後に,繰り返しになるが改めて強調しておきたい.このサイトは,CVとMLが好きな人向けの面白くて楽しい,自分も旅に出たくなるような地図であることも,こころがけたい.著者自身も,観光地や,家の近くにある京都に遊びに出まわるときに,そうしたガイドマップを片手に歩くのが好きである.このサイトも,旅行ガイドのように「探索心を掻き立てる観光ガイドマップとして発展させていきたい.

アフィリエイトプログラムの使用

当サイト「CVMLエキスパートガイド」は、amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである、 Amazonアソシエイト・プログラムの参加者です。