サイトと著者について

1. サイトの概要

CVMLエキスパートガイド』は,コンピュータビジョン(Computer Vision, CV)と機械学習 (Machine Learning, ML)を中心テーマにして,プロの研究・開発者や,もしくはそれらを目指している見習い中の方の学習支援を目的とした「ガイドマップ型構造の学習支援サイト」である.

サイトの構築・記事執筆は,コンピュータビジョンを専門とする Masaki Hayashi (研究業績ページ)が1人でおこなっている.今後は,このサイトのような「Webや動画講義,テキスト本の執筆などを通した学習支援」や「画像認識・映像認識チームを育てたい企業への研究開発者コーチ業」も,主たる仕事の1つとしていきたい.よって,その手始めとして,このサイトを2018年から構築開始した.

このサイトは,以下2つの主内容を通して,皆様「探求的・思索的な活動」を,日常的に強く支援する:

  1. 用語集」: 知識のレベルアップを支援 (Wiki構造の教科書)
  2. コラム」: 知恵 (思考法・ノウハウ)

この2つを通して,技術間の関連性を,わかりやすく構造的に提供することで,旅行ガイド本や,趣味・スポーツ別の攻略本のように学習・復習や,研究のアイデア出しの能力向上を助ける.それにより,日本の中間層全体のパワーアップの実現が,本サイトの1番狙いである(2節で詳述).

CVMLエキスパートガイドとあるように,1.「用語集」を中心に,旅行ガイド本・旅行案内人のように,技術間の関連性Wiki形式で,地図のように構造的に提供し,なおかつ教科書・テキストのような簡潔な用語記事をとおして,市販のテキスト相当の標準的内容を学べるようにしてある.つまり「用語集」では,Web上の無料Wiki型教科書の構築をしている.Web上で構造化していることは,皆様の効率的な学習・復習や,研究のアイデア出しを「探索化」「検索化」できていることを意味する.また,記事で参照している各元論文やテキストをこのサイトと合わせて読んでいただくことで,標準的な知識の徹底的な強化・復習を行いやすいサイト構造を意識してしている.ただ,それをWeb上で構造化させてある点が,書籍や他サイトとの大きな違いである.Murphy 氏のMLaPP の愛用者であった私は,MLaPP や その2022年の 続編が達成している「必要最小限の標準レベルの技術のみを,簡潔にわかりやすく厳選して順になぞっていく」という設計思想を,私もこのサイトで達成しようとしている(ただしテキスト構造ではなくWebサイト構造で).

しかし, 基本技術だけを羅列して説明しただけでは,原理や関係性がわからず,実際の使い方もイメージが沸かないので,応用が効かない.そもそも,コンピュータビジョンを初め,現代の計算機科学におけるパターン認識の大半は「応用」である.ということは,「使って役立ってナンボ」である.基礎や理論に詳しいだけで,応用(タスク)に弱い人だと,道具だけ知っていて応用できない.現場経験や,アカデミック側だとしても実応用経験が豊富でないと,成功・失敗例も知らないし,第一に,「何の問題を手につけるべきか」がまず判断できない(そうすると,特にビジネスでは利益につながらない研究ばかりにフォーカスする結果にもなる).

そこで,2.「コラム」を通して,中級者が必要な標準的な考え方やノウハウ,思考法や研究戦術など,要するに,プロを目指す脱初心者~中級者くらいの方や,プロの中でも中級者向けのガイドムックのようなものに相当している.実応用での勘所や,各タスクごとの記事(=応用の仕方) の提供も重視することで,どう使うかどう分析するかなどの「各知識の関係をもとに,どう実際に使うか・考えるか」の,知恵・ノウハウの向上も,大切にしたい.教科書に相当する「用語集」だけで終わらず,「コラム」も提供している理由はこれである.知識より知恵の方が高度であり,言語化もしづらい高価値のものであると思うが,「知恵」「メソッド」面も大切にしたい.

このサイトでは,深層学習流行以降の技術を主に取り上げる.ただし,それ以前の古典的な技術も大事にしている.また,本サイトを,「情報源のハブ」や「テキスト兼Wiki 代わり」として,日常的に利用して頂くことにより,皆様の日々の探究活動が,探究的思索的になり自由で楽しい旅へと変わることも狙っている.皆様の横に,「旅の案内人」と「ガイドムック」が味方している感覚で使用していただくと,日々の研究が探索的(知識・情報収集能力の向上),また思考的・思索的(知恵・アイデア創出の向上)なものとなり,更に充実した成果が出せるようになるはずである.

以上が概要であった.日常の研究開発(=旅)における探究活動を「もっと楽しい旅にするガイド」として,本サイトとをぜひ活用していただきたい.

1.1. 著作権について

概要を述べ終わったので,以降では詳細を述べていくが,最初に一番大事な著作権について書いておきたい:

本サイトの全ての内容,記事中のテキストおよび(自作した)画像の著作権は,全て著者である私,Masaki Hayashi に帰属するものとする.

1.2 管理人・執筆者について

管理人の私は,コンピュータビジョン研究者および,企業向けの研究アドバイザーなどを仕事で行っている林昌希(Hayashi Masaki) である.経歴や,得意分野,「ビジネス向けの研究」と「アカデミック寄りの研究」の両方を経験してきた話など,詳しい経歴や動機などは,以下の子ページに,別途まとめてある:

このページに書いたような経歴やバックグラウンドのある私は,中堅研究者・ビジネス経験者の立場から,自分だからこそできる 教科書にまとめるような,抽象度の高い話の紹介と,その構造的な整理に,このサイトや執筆・コーチング活動集中したいと考えている(逆に,PyTorch・Tensforflow2などソフトウェアの使い方や実装については,テキスト書籍も多いので,そちらに任せて多くは書かない).

※ 2022年4月追記:Flax・JAXを使い始めており,Flaxの使い方については,ネット上にも情報量がまだ少ないため,このサイトでも展開していくかもしれない.同じくビジョンの方たちはあまりしならない「HuggingFace Transformers」についても,積極的に紹介していくかもしれない.

関連記事:主要なDeep Learning ライブラリ・フレームワークの一覧

1.3 著者のターゲット「中間層の充実」

昔から一貫している,私のコンピュータビジョン業界への達成目標は『日本の中間層の充実(プロ,アマ限らず)』である.「中間層を暑くして,主人公を増やすこと」が,私の一貫した狙いである.

よって,このサイトのように,万人への貢献を狙っていく,下支え的な活動でいつも意識しているのは,初心者・若手層の底上げと,中間層のパワーアップである.先人の方々に,私も大変お世話になってきたのもあり,「次は自分が次の世代に貢献する番だ」という志のもとで,このサイトや,他の学習支援活動に取り組み始めている.

サイト構築における動機「中間層の充実」については,以下の記事に詳しくまとめてある.

子記事:サイトの動機・狙い: 中間層の充実

2. サイトの詳細

2.1 エキスパート向けの「ガイド」とは?

サイト名に「エキスパート(向け)ガイド」と入れてある通り,このサイトは,ガイドマップ(地図) のような構造・構成を意識している.たとえば,観光地に持っていく「るるぶ」や「地球の歩き方」のような役割や,現地ガイドやバスガイドみたな役割を目指している.つまりは, 読者が旅の主役となって,楽しく目的もある旅を続けるためのガイド本・観光ガイド」を提供したいのが管理人の動機である.よって,ただ単に,読者の成長をご支援するだけでなく,毎日のみなさまの研究開発活動が「面白く・より探究的になる」ことも狙っている.

サイトの内容は,ディープラーニング界隈の,近年の画像認識や機械学習の研究・技術の「知識知恵」両面での向上を目的とした構成である(1.1節で紹介).一方で,CVや画像処理の古典的な技術の紹介も大切にしている.ディープラーニングに手段が変わっても,多くの「昔から取り組まれているパターン認識系の問題」は,本質的な所があまり変わっていないものも多いので,管理人は「古典的技術」や「歴史的な変遷」も非常に大事にしている.

このサイトがターゲットとする「多くの中間的レベルの方々」に必要となるのは「ビジネス応用力=社会・人間に寄り添ったサービス・システムを作る能力」の高さでもある.そうした社会応用力にも強い人材になっていくには,これまでの過去の応用の知見を蓄えて活かす能力が不可欠であるので,歴史や先人の仕事に注意を払って学ぶ(もしくは学ばない)姿勢も非情に重要である.

以上より「用語集」においては,グローバルなサイト全体や親記事同士のレベルでは,地図や年表(歴史)として全体図を俯瞰できるようにし,ローカルな各子記事レベルでは,教科書・テキスト書籍のように,各用語の詳細と関係性を紹介する

つまりは,全体(Wiki構造と記事間・単語間のハイパーリンク)局所(各記事の,解説や図説)の,両方の質の高さに気を配った用語集にしている(詳しくは2.2節).

ぜひ,一人でも多くの方が,このガイドマップ型サイトを有効活用して,レベルアップしていただき,新たな主役として業界で活躍して頂くことを願ってやまない(私はその一番下で,アクセクと働く下支えの車輪でありたいです).

2.2 サイト構造の詳細

サイト全体として,読者が長く頻繁に(繰り返し)利用してもらうほど「知識・知恵」の双方が向上しやすいよう,その2つに対応した,以下の2つを主コンテンツとした2面的構造のサイトにしている:

  1. 用語集 (for 知識の向上):
    • 技術解説記事を,管理人流の解釈も加えて,
    • 階層的に提供.Wikiライクな百科事典かつテキスト記事的な構成.
  2. コラム (for 知恵の向上):
    • 論文の読み方や,Q&A記事など「知恵や手段の伸ばし方」を支援・案内できる記事を提供.
    • 学びかたの方法論やアウトプットの出しかた,日々取り組むべき作業過程についてなど,手段や知恵などの考え方を伸ばす,「思考法」「戦略」「論文の読み方」「分析法」などの記事群を提供.

各記事では,その技術やテーマの歴史経緯も記述して,年表的に頭に整理されて入っていきやすい記事構成も重視している.各技術の流れを知ったり,普段からその癖をつけて考えるようになることで,研究開発が,知的で面白い活動となることや,歴史的な経緯の理解に深い研究者を増やすことを狙っていきたい.

その意味でこのサイトは「歴史年表アプリ」としての機能も,備えていく予定である(記事が増えて充実していくほど,その機能が増していくはず).著者は中堅研究者なので,かつて学んだり使っていた「深層学習流行以前の古い技術」の紹介も行えるので,それらを紹介するだけでなく,現代の技術との関連付けすることも,このサイトでは重視する.

また,管理人の独自の解釈・階層的な整理も織り交ぜてある.ここで初めて知ることになった「そういうシンプルな話だったのか!」とハッとするような解釈もたまにあると思う.応用を重視するので,「各道具の使い方だけ書いてあるけど,じゃあどうやってそれを組み合わせていつ使うの?」とならないように,各タスクの記事(例:物体検出・セグメンテーションなど)の充実も通して,「いつどの部品・道具を,どのように実際には組み合わせて問題を解くか」を,読者も常に考える癖がつくような記事内容・サイト構成を意識している(※ 工具の説明動画を個別に見せられても,素人はそれだけでは家を最後まで建てられない).

各記事の文章説明内だけでなく,「図(の構成)」や「記事間のリンク」「記事全体の階層的カテゴリー構造」を通しても,「これまでなかった,分かりやすい新解釈」を提供していきたい.つまり,「図」や「ページ間の関係」自体にも,私独自の新規の解釈が含まれている場合もあるので,論文自体や他のテキストと比較して,新しい視点がないかを気を配っていただけると,気づきがあると思う.

※ そうした,元の論文や他の解説記事・テキストでは見たことがない「このサイトで初めて知った解釈・分析説明方法」については,出元が私の記事であることを,きちんと言及して引用していただけれると助かる(無料でサイトを提供してはいるが,無断盗用したり,あたかも自分の考えた解釈や分析のように見せることだけはやめていただきたい).逆に,私も,参考にした引用元のページのリンクは,かならず載せるようにして気を配っている.

一府で,考え方や方法論をテーマとした「コラム」記事にかぎらず,知識「用語記事」中にも 管理人の考え方や発想法を,記事中に,ちょくちょく挟むようにしている.知識習得も大事であるが,同時に「手段」や「方法」の実力を伸ばすことも,非常に大事だと信じているからである.

例えば用語記事の1つを読んで,「説明がわかりやすかった」と思ったからといって,内容をそのまま鵜呑みにしては良くない.自分では何も考えずに,意味もわからず考えずに身に付けた「表面的な知識」ほど,使えないものはない(場合によっては,発信者の知名度や表面に騙される).成長していくには,何事にもまず疑問を持って,込められている「意味」や「意図」を考えられるようになるのが,応用力を伸ばし成長して上で大事であると,管理人は考える.

ぜひ,このサイトの各記事も,丸暗記したり鵜呑みするのではく「どういうことかな?」「なぜかな?」と常に考えながら生活する癖をつけていただきたい.そのために用意しているのが「コラム」である.「用語集」だけのサイト構成だと,考える癖がつかないまま育つ危険性があるからである.

3. サイトの「目的 」とその背景

3.1 サイトの目的を達成するために狙っている構成

CVMLエキスパートガイドでは,総合的なガイドマップとして教科書的な情報を集約しておき,ユーザーの方々が,日常的に便利に利用できる「情報集約サイト」構築を通して「(専門が近い)研究開発者の方々への,学習および研究活動の支援」を行うことを目的としている.そして,エキスパートガイドと書いたように,「広く中間層全体に」その支援を行うイメージで,サイトを日々構築している.概要の1.3節で述べたとおり,以下の子記事に「中間層の充実」という目的・動機については,別途詳しく述べてある.

子記事:サイトの動機・狙い: 中間層の充実

さて,この動機を達成するために,このサイトでは特に,読者の「学習・分析・整理(入力」と「アイデア出しや成果物の洗練(出力)」の2面について,強力に支援することを狙っていきたい.よって,「知識(用語集)と知恵(コラム記事)」の双方が伸ばしやすい構成のサイトを提供する.

ここからは,その目的を達成するために,「サイトの機能(3.1.1)」や「サイトの階層的構造(3.1.2)」「コラムの設置の意味(3.1.3)」で,それぞれ何を狙っているかについて,順に述べていく.

3.1.1 サイトの主機能:「Wiki型ガイドマップ」

このサイトの「用語集」では,「エキスパートガイド」の名前の通り「観光地ガイドマップ」のような役割・機能を持たせている.旅行ガイドブック程度の簡潔さを持ち,そのなかで,名所(押さえておきたい標準的な内容)の網羅をおこなっていく.つまりは,このサイトの各記事が簡易的な各項目への導入となっており,尚且つそれら名所となる用語・項目同士の関連づけの地図となっている.

よって,このガイドマップ型サイトを日常的に繰り返し使用していただければ,それらの関連性が,階層的・グラフ的サイト構造を通して自然と身につくことが,著者が「サイトの階層化・Wiki的構造化」を通して,最も狙っている点である.

3.1.2 サイトの階層構造:Wikiライクな辞書でありながら「考えること」も重視

論文や専門書それぞれにリーチする前にも「この技術やこの論文だけは最低限,プロなら押さえておきましょう」という標準的内容を本サイト内だけで辿れる知識集約サイト外部情報へのハブサイトを構築したい.

つまり,このサイトを普段使いしていただいて,繰り返し各ページを読みなおし,なおかつその各ページに紐付く元論文や,外部サイトやテキストを復習すればするほど,サイト全体の内容(および構造・関係性)が,体系的な知識として脳内に(苦労なく)自然と染み付いていくはずである.

このサイト構造により,「読者にとって重要な情報」にも,たどり着き,しかもこのサイトで紹介している場合はテキスト説明から概要も得えやすいので,深く自分で読みとき考えられるガイドとなることを狙っている(ただし,私1人で執筆しているサイトなので,5年くらい経過しないと,たいした網羅度のサイトには発展しないかもしれないが).

3.1.3 「コラム」も設置し「考える人」になっていただく.

一方で,このサイトの「用語集」に,私が配置した情報を「何も考えないで丸暗記(=意味を考えないまま上辺の知識だけを身に付ける)」したのでは,意味が無くもったいない.そこで,前述のように,用語記事中にも,管理人の考えかたをちりばめてあり,知識だけに終わらない「考える」ところや「考え方の紹介」も設けた用語辞典にしている.

また,コラム記事では,「考え方」「解きかた」「Q & A」など,知恵・考えること(=鵜呑みにしないで意味も考えること)を重視する構成にしている.これにより「つねに疑問を持つ・つねに意味を探る」ことを重視できる.

また,私は歴史に加えて語義も重視している.管理人は,各用語についても「なぜその名前になっているのか」も,常に考えるようにしている.

3.2 「自分の軸」を育るために:標準的な基礎の習得を支援.

あくまでガイドマップなので,研究のスピードアップと効率化や辞書目的にだけ使っていただきたいとも思う.教科書テキストのように,このサイト全部をきちんと読み通していただくことは意図していない

また,2次情報だけに頼ることは良くないので,なるべく避けてもらいたい.1次情報である論文自体をきちんと自分で読むだけでなく,自分で論文を書いたり,実験したり,周りの同僚と議論したり,実際に業務で研究を行ったりする中で,必ずご自身の頭と体を使って技術を身につけて頂くのが私からの願いである.そして,自分の軸を大切にして,これまでの常識や枠をはみ出すことを心がけていただきたい.管理人は,みなさんが「自分がどうありたいか」「自分が何を狙っているか」を自分で育てて確立していくことが大事だと考える.その「自分の軸」を皆様が育てる際の,後方支援を私の方で行えれば幸いである.

3.2.1 もちろん基礎の習得は大事なのだが…

私が,他人を指導させていただく際の方針は「基礎の定着はすっ飛ばして,即実践に入ることが大事」というものである.研究をはじめたてのころは,まず自分で研究のプロセスを一通り踏むことがなにより大事と考えており,「習うより慣れろ」である.

基礎の習得も当然大事なのであるが,プロになるまでに徐々に習得していけばよい.なぜなら初級~中級では,知識の本質をつかんだり,型の意味を咀嚼することは,(プロにまだなっていない時点で)どうせ深く本質的に理解できているはずはなく,無理だからである.中堅に入りつつある私でも,基礎力はまだまだ足りていないはずであり,今後も勉強中の状況は続くものであると思っている(機械学習業界は,移り変わりも速いので).

先に実践なく基礎だけ積み上げる作戦は,よほど時間が豊富にあって余裕がある人や,トップ研究者なら取ってもよい戦略だとは思う.しかし,一般的な人にとっては,さきに全ての基礎を完璧にこなしておくのは,時間的に不可能である(そもそも今のコンピュータサイエンスは学ぶべき基本事項が膨大である).よって,学習内容が膨大なCVML関連やその界隈の分野の皆様が,基礎の網羅的な習得はいったん脇に置いて,まずはアウトプット重視で突き進む一助にこのサイトが少しでも貢献できれば,業界全体の中間層充実の加速につながると思っている.

あなたが優秀で,学生の頃からトップ成果を出している層でないかぎり,間違っても若手の頃から「このサイトに載っていることを全部よく知っておこう」としていくのは,オススメしない.今のディープラーニング界隈は,膨大な全ての情報を追うのは無理なので,その方針は基本的には誤りである.

現代は,膨大で追いきれない大量の情報のうち,「自分にとって」重要な情報にだけ探索的にフォーカスを当てるのが基本的には正しい作戦である.その探索的・検索的な活動を支援する情報ハブ兼テキストとして,「用語集」を提供している.また「コラム」では,論文の検索法や読み方記事なども提供するので,そもそも「どのように探索するとよいか」の手段の話も提供する.これにより,このサイトの外でも,どのように検索や探索を行い,サーベイをして,それを出力に結び付けるかの知恵・手段の話も展開している.

4. 記事のカテゴリー分類

このサイトは「10年後もあまり情報の価値が廃れることのなく、かつ大学教員が提供するような専門性の高い教科書的な情報の提供」にフォーカスしたい.そもそも,将来的には教科書・テキストを書いたり,Webで動画コースも提供していきたいのであるが,まず情報の関連性や集約性を一番良くできるのはWebページであると,サイト開設時に感じていた.従って,最初はこのWebサイトから提供を始め,十分に記事数が溜まってサイトの質がよくなってきて以降,書籍や動画講義に,Youtubeなどを公開していく手順とした.

(これらの,学習支援環境の構築活動に対して,スポンサー支援などで,強くご支援いただける企業・個人などがいらしたら,お声がけして頂けると嬉しい)

4.1 記事の分類一覧

本サイトでは,以下の「記事カテゴリ」に大きく分類して記事を投稿し,研究者向けの各種情報をガイドする(上部メニュー(青色)から,各カテゴリーのトップ記事へアクセスできる.また上部サブメニュー()からそのうち,よくアクセスするページのみへリンクを張っている):

  • 用語集 (全記事リスト) [ for 知識の向上 ]:
    • コンピュータビジョンと機械学習・画像認識における専門用語の記事を増やしていき,本サイト内で階層的Wiki化を行う.記事中で紹介した用語が紹介されているWikipediaページ・書籍・論文も記事に関連情報として添えて,詳しいところはあくまで自学してもらうようにしたい.
    • 本サイトは前述の通りあくまで「ガイドブック役に徹するので,各項目は百科事典レベルまでのまとめ記事にとどめ,詳細な深入りまでは行わない.逆に言うと,Wikipediaの記事などと同じで「詳細は省いた簡潔な百科事典」をこのサイトが構成できるはずである.
    • とはいえ,各用語記事はテキストのように詳しいながらも簡潔に書き,他にはない一番のレベルを目指したい.そして,詳細さよりも私が持ってる独自の視点・経験を少し盛り込むことを情報量的には重視する(特に応用するための知見も.ただし本当に手伝って欲しい方は仕事でコーチを依頼していいただきたい).
    • 英語圏でのMediumや,中国のZhihuなどで見られるような「博士号を持った方や研究に詳しい方が,質の高い研究解説記事をWeb上にも沢山書いている状況」を,日本でも起こせる一助となればと思っている.
  • コラム記事[ for 知恵 の向上]:
    • Q & A記事 (2021年6月スタート):
      • 英語圏では Quora や Reddit のようなところで,互助的に高度な意見交換や議論が活発に行われている一方で,日本にはオープンなWeb上にはそういう深い議論が交わされる場所が形成できていない.
      • 勉強会文化はあるものの,他人の論文を読んで内容を共有する講義形式のものが主流なので,インタラクティブ性やワークショップ性には欠けている.とりあえず私個人でこのサイトで「疑問」や「問い」を考えて,それに自分で答えるQ&A記事を,細々と書いていくことにした (要するに,自問自答記事である)
    • CVML論文の検索法(2021年11月スタート):
      • 論文を検索する際には,論文のタイトルにあるパターンを若い頃から知っていると便利なのだが,なかなかそれを教えてくれる人もおらず,パターンをまとめてくれている書籍などはない.そこで,CV分野に限るものの,論文のタイトルや内容の典型パターンを紹介していく.
  • ソフトウェア(2021年6月スタート):
    • 以前はOpenCVかMatlabあたりに詳しいことが,CV分野の研究・開発者には大事であった.
    • それが,近年は PyTorch や Tensorflow などのディープラーニング向けライブラリに習熟する必要があり,更に,主要なソフトウェア・手法の構築方法を押さえておくことも大事である .
    • ただし,各ライブラリのチュートリアルや細かい話までは,書籍やWebコースが多くに任せられる.よって,本サイトは,主要ライブラリの概要とリスト化のみおこない,各ライブラリの基本情報を簡潔におさえられることだけをしておきたい(私は用語集やコラムで提供する話しに注力する).
  • おすすめ書籍
    • 大学院生向けの教科書や,研究者向け専門書を厳選したものを紹介する.
    • 用語記事数が100を超えて,このサイトが充実してきたら,研究者や管理職としての働き方を学ぶためのおすすめ書籍も紹介していきたい.(ライティング術や,計画スケジューリング系の書籍,コーチングテクニック,思考法・アイデア術の本など).
  • 検索専用ページ(2022年3月スタート):記事数の増加に伴い,カテゴリーやタグで記事を検索する専用ページを設置:

5. CVとMLにフォーカスする理由

管理人は、「画像認識・コンピュータビジョン全般」(CV)と「機械学習・深層学習(の特に実応用)」(ML)を,主なビジネス専門分野とし,かつ研究興味としている.よって,素直にそれらのCVとMLを主テーマとするサイト構成にした.

「CVML」という組み合わせについては,ブログの「機械学習とかコンピュータビジョンとか」さんのタイトルにならって,「CV」と「ML」での組み合わせを選んだ.

補助テキストに岡谷先生のテキスト「深層学習」と原田先生のテキスト「画像認識」を採用しているようにに,当サイトの「用語集」は,基本的には「教科書やテキスト的」な情報提供である.ただし,実応用も意識して各記事を書いているゆえ,大学の先生が書く本よりは,抽象度は少し低く具体性が少し高い記事になるよう意識している.

また「コラム」でノウハウや思考法や論文の読み方などについても提供している点が,ナレッジサイトとは異なる特徴である.

5.1 動機

以前から,ビジョン系および深層学習・機械学習周辺の研究コミュニティでは,身につけておきたい基礎的な内容が膨大であって,非常に辛いという問題を抱えている.それら基礎教養の全てを知る必要は必ずしもなくとも,ビジョン系の学会では細分化されず,それらの全ての内容が1つのコンピュータビジョン会議に集結するので,なんとなくでも各項目について知っておいた方が見聞は広まるしアイデアも出てくる.広くアンテナが張れるようになれば,「あの人の技術や研究能力を頼りたい」と思うことも出てきて,その人に共同研究や共同開発をお願いしに行けるようにもなる.

深層学習ブーム以降,その「浅くても良いので知っておく方がよい基礎知識量」の,雪だるま的な膨大化が,更に加速していると感じる.深層学習は,その「モジュール結合の容易性」により,マルチモーダルやマルチタスク学習の容易さも増した.しかし,それは近隣分野との融合研究の増加にもつながった.そのせいで,各分野間の境界領域では問題設定が混ざったり,過去の2分野以上の問題を合わせて解くことも多い(Vision and Language や text2speech など).更に,どの問題に対しても押し並べて強い「Transformer,BERT」などの登場で,尚更のこと,パターン認識系の各分野間の垣根がなくなりつつある.

そうした中で,コンピュータビジョンと深層学習時代の標準的内容をこのサイトで日本語でWiki的構造でなおかつ,重要なところをかいつまんで早く知るガイドマップを提供できれば,今後,長期的に20年~30年皆様に役に立つサイトを構築していけるはずだと考えて,このサイトをCV,MLをターゲットに立ち上げた.要はWeb上に無料で「Wiki構造の教科書(=用語集)」と,「それら技術の使い方,学びかた,論文の読み方,書きかた(=コラム)」を提供してしまおうというわけである.

授業スライドやWeb動画講義のようなシーケンシャルな書籍的階層構造と,私のWiki的構造のCVMLエキスパートガイドでは,果たす役割や効能は違うので,それぞれの使い分けには注意されたい.テキスト・書籍や講義も,良いところが当然ある.一方で,このサイトは今後数十年に渡って記事を貯めて増やしていく予定であるし,WikipediaなどのWiki構造辞書サイトと同じく,各記事もどんどん動的に更新できる「成長・リライトできる強み」を持つ点が,動画講義や書籍とは一番性質が異なる点である.

動画講座や書籍は,版を重ねるまで固定化してしまうし,各情報に絞って検索しづらい.また,本にしてしまうと,各項目はWikipediaほど深く掘り下げた記事にはできない.

5.2『日本語で』届けたい.

かつて「コンピュータビジョンのセカイ」をマイナビ様に連載提案をした頃から,私の一貫しているコンピュータビジョン情報発信の動機がある.それは「英語圏のWebでは大量にコンピュータサイエンスの情報があるが,日本語にはそういった情報源が少ない」という動機である.(既に削除した)前身のブログ「DERiVEコンピュータビジョンブログ」も,同じ動機であった(ただ,当時の私は未熟であったたので,今ほど高レベルの内容を提供できなかったが).

コンピュータサイエンスにおいて,すっかり米国の次の2番手になった中国圏でも,現在では知乎(zhihu)などのサイトを中心に,洗練された情報が中国語で大量に出回っている.そうした中,日本語での情報提供は皆様にもぜひ頑張っていただきたいので,そう主張するのであればまず自らも行動で示していきたいというのが,このサイトを開設した理由の1つでもある.

知能的・機械的なタスクを人間以外に任せることが加速的に進んでいる現在,(それでも)働きたい人にとって大事なのは,入力(分析力・破棄力)と出力(創造力・設計力)の質である.良いものを取り入れて,そこから良いものを出せることができるのが次世代のプロフェッショナルである.

そのために,情報の大海に溺れずに,自分自身に特有の探求先に強くフォーカスできるように,ぜひ,このガイドマップとしてこのサイトを長く有効活用していただきたい(短い時間でも良いので,自分自身でWebで発信して,出力も積極的に行っていくことが大切であることも付け加えておく).私のサイトは,授業的な「私→みなさん」ではない.Wikiやコラム群など,探索的で,能動的に自分の興味に従って自分で探索して頂く構造を意識している.

最後に,繰り返しになるが改めて強調しておきたい.このサイトは,CVとMLが好きな人向けの面白くて楽しい,自分も旅に出たくなるような地図であることも,こころがけたい.著者自身も,観光地や,家の近くにある京都に遊びに出まわるときに,そうしたガイドマップを片手に歩くのが好きである.このサイトも,旅行ガイドのように「探索心を掻き立てる観光ガイドマップ」として発展させていきたい.

アフィリエイトプログラムの使用

当サイト「CVMLエキスパートガイド」は、amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである、 Amazonアソシエイト・プログラムの参加者です。