このサイトと著者について

1. このサイトの概要

このサイト『CVMLエキスパートガイド』は,コンピュータビジョン(Computer Vision, CV)と機械学習 (Machine Learning, ML)を中心に,その界隈の研究・開発者や,もしくはそれらを目指している見習い中の方向けの,ガイドマップ型のサイトである.コンピュータビジョン・パターン認識大好きマンである,中堅の研究開発研究者であるMasaki Hayashi(研究業績ページ)が,このサイトの構築・記事執筆をおこなっている.

サイト名に「エキスパート(向け)ガイド」とある通り,関連分野全体のガイド地図である.観光地に持っていく「るるぶ」「地球の歩き方」のような役割をめざしている.つまりは 読者が旅の主役となって,楽しく旅をするためのガイド本・観光ガイド」を提供したい.サイト内容は,ディープラーニング界隈の,近年のパターン認・識機械学習の研究を中心にしているが,コンピュータビジョンや画像処理の,昔からの「古典的な技術の紹介」も大切にしている.ディープラーニングになっても,昔から取り組まれている問題は,本質的な所は全く変わっていない面も多い.従って,歴史を知ることは大事だからである.

よって,このサイトは,(グローバルな)サイト全体や親記事では,地図や年表として,全体図を俯瞰できつつも,(ローカルな)各記事では,教科書やテキスト書籍のように,各用語の詳細と関係性を,便利にガイドすることを目標としている(詳しくは2節).

本サイトの全ての内容,記事中のテキストおよび(自作した)画像の著作権は,全て著者である私,Masaki Hayashi に帰属するものとする.

1.1 サイト構造と,内容の独自性

イト全体としては,読者が長く頻繁に利用してもらうほど 知識・知恵の双方が向上しやすいように,以下の2面構造にしている:

  • (1) 用語集 (for 知識):技術解説記事を,管理人流の解釈も加えて,階層的に提供(こちらがメインの内容).
  • (2) コラム記事 (for 知恵):論文の読み方や,Q&A記事など「知恵や手段の伸ばし方」を支援・案内できる記事を提供.

各記事では,その技術や話題の歴史経緯も記述して,年表的に頭に入っていくことも重視する.各技術の流れを知ったり,普段からその癖をつけて考えるようになることで,皆様の研究開発が,知的で面白い活動となることや,歴史的な経緯の理解に深い研究者を増やすことを狙っていきたい.その意味でこのサイトは,「歴史年表アプリ」としての機能も持っているといえる.著者は中堅なので知っている,「ディープラーニング流行以前の古い技術」との関連付けも,本サイトでは重視している.

また,管理人の独自の解釈・階層的な整理も織り交ぜてある.ここで初めて知ることになった「そういうシンプルな話だったのか!」とハッとするような解釈もたまにあると思う.文章自体以外にも,図や階層構造自体に,新規の解釈が含まれている側面もある.

そうした,元の論文や他の解説記事・テキストには見られない「このサイトで初めて知った解釈・分析」については,出元が私の記事であることを,きちんと言及して引用していただけれると助かる(無料でサイトを提供してはいるが,無断盗用したり,あたかも自分の考えた解釈や分析のように見せることだけは,やめていただきたい).

加えて,知恵や考え方を伸ばすことが重視の「コラム記事」にかぎらず,「用語記事」中であっても 管理人の考え方や発想法を,記事中に,ちょくちょく挟むようにしている.それは,知識も大事であるが,同時に「手段」や「方法」の実力を伸ばすことも非常に大事だと考えてるからである.鵜呑みにして考えないで身に付けた知識ほど,使えないものはない.成長していくには,何事にもまず疑問を持って,こめられている意味や意図を考えられるようになることが,応用力を伸ばす上で大事である.

ぜひ,このサイトの記事も,暗記したり鵜呑みするのではく「どういうことかな?」「なぜかな?」と常に考えながら読んでいただきたい.

1.2 管理人・執筆者について

私は,画像認識・コンピュータビジョン研究者・企業向け研究アドバイザーなどを行っている Masaki Hayashi である.著者は,修士課程修了後の新卒時は,サラリーマンとして4年システム開発者として働いたあと退職し,フルタイムの学生として,働きながら生計も立てつつ博士課程に進学した.自分で言うのもおかしいな話だが,多様で変な経歴の持ち主である.

経歴や,得意分野,あるいはビジネスと研究両方やってきた件などの,詳しい経歴や動機などは,以下の子ページ「著者について」に分離してまとめてある.興味がある方はそちらをご覧頂きたい:

そういった経歴の私は,中堅研究者・ビジネス経験者の立場から,自分だからこそできる 教科書にまとめるような,抽象度の高い話の紹介と,その構造的な整理に,このサイトや執筆・コーチング活動集中したいと考えている.(逆に,ソフトウェアや実装については,そこまで多くは書かない).

1.3 著者のターゲット「中間層の充実」

私の昔から一貫している「コンピュータビジョン業界への達成目標」は,『日本の中間層の充実(アマ,プロ限らず)』である.中間層を暑くして,主人公を増やすことが,私の一貫したターゲットである.

このサイトのように他人に貢献する活動でいつも意識しているのは,初心者・若手層の底上げと,中間層のパワーアップによる,中間層の充実である.そういった「後進育成」や「業界活性化」をがんばって来られた先人の方々に,私も大変お世話になってきた.よって「次は自分が次の世代に貢献する番だ」という志のもとで,2018年以降このサイトや,他の学習支援活動に取り組み始めている.

国全体を見た時の課題意識

機械学習分野に限らないが,産業社会の現代において,強くて幸せな国には「多くの中間層が存在して,所得レベル・実力レベルのバランスが取れている」ことが欠かせない.海外の各産業国のような,昔から根強い階級制度・階級社会は日本には(見た目ではあるが)存在せず,一見すると,住んでいるところも,見た目も,全員さほど違いがないのが,日本の戦後社会の特徴である.

高度成長期中盤以降からバブルの頃は,日本人はいわゆる「一億総中流」の分布であった(これも,ある種幻想ではあったかもしれないが).それが,この「失われた20年」において,弱国化政治が一貫して行われてきて,すっかり中間層が取り払われてしまい,日本も上流と下流に2極化されてしまっている.著者はコロナ中に,地元の大阪へと戻ってきたが,大阪の寂れ具合や,老人化を目の当たりにしている.ポジティブな戦略として国全体で規模をさげて幸せ社会への移行と銘打っていたのであれば,特に問題はないと思うが,とにかく「アンバランス」化しており格差があるのが問題なのである.よって,コロナ後のいま何よりも,大事なのは,格差社会が増してしまった「平成のころの最悪な状態」から,「中間層が最大分布である,均質と多様のバランスが取れた状態」の日本を取り戻すことだと感じている.

よって,私の場合は以前とやることにブレは無いのだが,以前と同じく引き続き「中間層の充実」を目指した支援を行い,アンバランスさの緩和に,微力ながら貢献していきたい.このサイトの構築や,本の執筆や動画講義の公開などを行い,今後は学習支援業・コーチ業にも仕事をシフトしていき,皆様への「これまで以上に幅を広げた」下支えを行っていきたいところである.

ただし,学習支援も万能ではない

私は自分のこのサイトの活動を「学習支援」と呼ぶようにし,一般に言われる「教育」という呼びかたはしないようにしている.私は「教育」という言いかたは,押し付けや洗脳・統制的なので好きではない.教育より自発的で,自由な「学習」が身に付くことが重要だからである.

学習支援だけを頑張れば,日本や世界の社会問題解決がうまく達成できるとは,著者は必ずしも思ってはいない.学習支援や,ビジネスでの学習支援といった,いわゆる「教育だけで全てが解決する」と思うのは,幻想だと思うからである.社会の変動には,政治や流行,裏ではたらく力など,さまざまな要因があり,学習支援だけで全てが解決するわけではない.

ただ,日本ではあまり取り組まれていない「中間層への支援」が,根本的な問題であり,国の良さを取り戻す,最優先課題であると考えている(あと,遊びや時間のゆとりが足りていない,というのも個人的には感じるところである).

2. サイトの「目的 」とその背景

2.1 サイトの目的と狙っている構成

CVMLエキスパートガイドでは,総合的なガイドマップとして教科書的な情報を集約しておき,ユーザーの方々が,日常的に便利に利用できる「情報集約サイト」構築を通して「(専門が近い)研究開発者の方々への,学習および研究活動の支援」を行うことを目的としている.そして,エキスパートガイドと書いたように,「広く中間層全体に」その支援を行うイメージで,サイトを日々構築している(そういうサイトを構築している動機や課題意識は,1節で話してきたとおりである).

このサイトでは特に,読者の「学習・分析・整理(入力)」と「アイデア出しや成果物の洗練(出力)」の2つについて,強力に支援することを狙う.そのため「知識(用語集)と知恵(コラム記事)」の双方が伸ばしやすい構成すのサイトを提供する.

ここからは,その目的にそった「サイトの機能」や「サイトの階層的構造」に「狙っていること」を順に述べていく.

サイトの主機能:「ガイドマップ」

このサイトは,「エキスパートガイド」の名前の通り「観光地ガイドマップ」のような役割・機能を持たせている.旅行ガイドブック程度の簡潔さを持ち,そのなかで,名所(押さえておきたい標準的な内容)の網羅をおこなっていく.つまりは,このサイトの各記事が簡易的な各項目への導入となっており,尚且つそれら名所となる用語・項目同士の関連づけの地図となっている.

よって,このガイドマップ型サイトを日常的に繰り返し使用していただければ,それらの関連性が,階層的・グラフ的サイト構造を通して自然と身につくことが,著者が「サイトの階層化・Wiki的構造化」を通して,最も狙っている点である.

Wikiライクな辞書サイトだが「考えることを重視」

論文や専門書それぞれにリーチする前にも「この技術やこの論文だけは最低限,プロなら押さえておきましょう」という標準的内容を本サイト内だけで辿れるWikipedia的な知識集約サイトを構築したい.つまり,普段使いしていただければいただくほど,勝手に体系的な知識としてサイト全体の内容が脳内に自然と染み付いていくはずである.

これにより「読者にとって重要な論文」にたどり着き,しかもこのサイトで紹介している場合はその概要も得た上で,深く自分で読み解き考えられるガイドとなれば幸いである(ただし,私1人で執筆しているサイトなので,5年くらい経過しないと,たいした網羅度のサイトには発展しないかもしれないが).

一方で,このサイトの用語辞典にガイドマップ的に,私が配置した情報を「何も考えないで丸暗記(=意味を考えないまま上辺の知識だけを身に付ける)」したのでは,意味がなくてもったいない.そこで,前述のように,用語記事中にも,管理人の考えかたをちりばめてあり,知識だけに終わらない「考える」ところや「考え方の紹介」も設けた用語辞典にしている.

そして,コラム記事では,「考え方」「解きかた」「Q & A」など,知恵・考えること(=鵜呑みにしないで意味も考えること)を重視する構成にしている.これにより「つねに疑問を持つ・つねに意味を探る」ことを重視できる.

また,私は歴史に加えて語義も重視している.管理人は,各用語についても「なぜその名前になっているのか」も,常に考えるようにしている.

2.2 「自分の軸」を育るために:基礎の高速な習得を,このサイトが支援.

あくまでガイドマップなので,研究のスピードアップと効率化や辞書目的にだけ使っていただきたいとも思う.教科書テキストのように,このサイト全部をきちんと読み通していただくことは意図していない

また,2次情報だけに頼ることは良くないので,なるべく避けてもらいたい.1次情報である論文自体をきちんと自分で読むだけでなく,自分で論文を書いたり,実験したり,周りの同僚と議論したり,実際に業務で研究を行ったりする中で,必ずご自身の頭と体を使って技術を身につけて頂くのが私からの願いである.そして,自分の軸を大切にして,これまでの常識や枠をはみ出すことを心がけていただきたい.管理人は,みなさんが「自分がどうありたいか」「自分が何を狙っているか」を自分で育てて確立していくことが大事だと考える.その「自分の軸」を皆様が育てる際の,後方支援を私の方で行えれば幸いである.

もちろん基礎の習得は大事なのだが…

私が,他人を指導させていただく際の方針は「基礎の定着はすっ飛ばして,即実践に入ることが大事」というものである.研究をはじめたてのころは,まず自分で研究のプロセスを一通り踏むことがなにより大事と考えており,「習うより慣れろ」である.

基礎の習得も当然大事なのであるが,プロになるまでに徐々に習得していけばよい.なぜなら初級~中級では,知識の本質をつかんだり,型の意味を咀嚼することは,(プロにまだなっていない時点で)どうせ深く本質的に理解できているはずはなく,無理だからである.中堅に入りつつある私でも,基礎力はまだまだ足りていないはずであり,今後も勉強中の状況は続くものであると思っている(機械学習業界は,移り変わりも速いので).

先に実践なく基礎だけ積み上げる作戦は,よほど時間が豊富にあって余裕がある人や,トップ研究者なら取ってもよい戦略だとは思う.しかし,一般的な人にとっては,さきに全ての基礎を完璧にこなしておくのは,時間的に不可能である(そもそも今のコンピュータサイエンスは学ぶべき基本事項が膨大である).よって,学習内容が膨大なCVML関連やその界隈の分野の皆様が,基礎の網羅的な習得はいったん脇に置いて,まずはアウトプット重視で突き進む一助にこのサイトが少しでも貢献できれば,業界全体の中間層充実の加速につながると思っている.

あなたが優秀で,学生の頃からトップ成果を出している層でないかぎり,間違っても若手の頃から「このサイトに載っていることを全部よく知っておこう」としていくのは,オススメしない.今のディープラーニング界隈は,膨大な全ての情報を追うのは無理なので,その方針は誤りである.現代は,膨大で追いきれない情報のうち,「自分にとって」重要な情報にだけフォーカスを当てるのが基本的には正しい作戦である.それを支援するガイドとして,情報を他よりもうまく集約した「エキスパートガイド」を提供したい.この意味で,私のやろうとしている学習支援の方法は,ある種,幼児向けの「モンテッソーリ教育」に近いとも思っている.

4. 記事のカテゴリー分類

このサイトは「10年後もあまり情報の価値が廃れることのなく、かつ大学教員が提供するような専門性の高い教科書的な情報の提供」にフォーカスしたい.そもそも,将来的には教科書・テキストを書いたり,Webで動画コースも提供していきたいのであるが,まず情報の関連性や集約性を一番良くできるのはWebページであると,サイト解説時に感じた.よって,最初はこのWebサイトから提供開始し,ある程度記事数が溜まってきたのち,テキストや講義やYoutubeなどを公開していく手順とした.

そうはいっても,私も本業の隙間でこのサイトをコツコツ書くことしかできないので,基本的な用語の記事が埋まるだけでも結構な年月は必要だと予想している.もし本サイトの構築活動に対して,広告出稿やスポンサー支援などで,強くご支援いただける企業・個人などがいらしたら,お声がけをして頂けると非常に助かる.

4.1 分類一覧

本サイトでは,以下の「記事カテゴリ」に大きく分類して記事を投稿し,研究者向けの各種情報をガイドする(上部ツールバーから,各カテゴリーのトップ記事へアクセスできる):

  • 用語集 (全記事リスト) [ for 知識 ]:コンピュータビジョンと機械学習・画像認識における専門用語の記事を増やしていき,本サイト内で簡易Wiki化を行う.記事中で紹介した用語が紹介されているWikipediaページ・書籍・論文も記事に関連情報として添えて,詳しいところはあくまで自学してもらうようにしたい.本サイトは前述の通りあくまで「ガイドブック役に徹するので,各項目は百科事典レベルまでのまとめ記事にとどめ,詳細な深入りまでは行わない.逆に言うと,Wikipediaの記事などと同じで「詳細は省いた簡潔な百科事典」をコノサイトが構成できるはずである.サイト全体としてのレベルは,他にはない一番のレベルを目指したい.そして,詳細さよりも私が持ってる独自の視点・経験を少し盛り込むことを情報量的には重視する.英語圏でのMediumや,中国のZhihuなどで見られるような「博士号を持った方や研究に詳しい方が,質の高い研究解説記事を沢山書いている状況」を,日本でも起こせる一助となればと思っている.
  • コラム記事[ for [知恵す:
    • Q & A記事 (2021年6月スタート):英語圏では Quora や Reddit のようなところで,互助的に高度な意見交換や議論が活発に行われている一方で,日本にはオープンなWeb上にはそういう深い議論が交わされる場所が形成できていない.勉強会文化はあるものの,他人の論文を読んで内容を共有する講義形式のものが主流なので,インタラクティブ性やワークショップ性には欠けている.とりあえず私個人でこのサイトで勝手に疑問や問いを考えて,それに自分で答えるQ&A記事を,細々と書いていくことにした.(要するに,自問自答記事である)
    • CVML論文の検索法(2021年11月スタート):論文を検索する際には,論文のタイトルにあるパターンを若い頃から知っていると便利なのだが,なかなかそれを教えてくれる人もおらず,パターンをまとめてくれている書籍などはない.そこで,うちの分野に限るものの,論文のタイトルや内容の典型パターンを紹介していくことにした.
  • ソフトウェア(記事一覧)(2021年6月スタート): 以前はOpenCVかMatlabあたりに詳しいことが,コンピュータビジョン分野の研究・開発者には大事な点だった.それが,近年は PyTorch や Tensorflow などのディープラーニング向けライブラリに習熟する必要があり,更にその中でも主要なソフトウェアや手法の構築方法を押さえておくことも大事である .ただし,各ライブラリのチュートリアルや細かい話までは,書籍やWebコースが多くに任せられる.よって,本サイトは,主要ライブラリの概要とリスト化のみを行って,各ライブラリの基本情報を簡潔におさえられることだけをしておきたい.
  • おすすめ書籍:大学院生向けの教科書や,研究者向け専門書を厳選したものを紹介する.また,研究者や管理職としての働き方を学ぶためのおすすめ書籍も紹介していきたい.(ライティング術や,計画スケジューリング系の書籍,コーチングテクニックや管理職向け書籍など).

4. CVとMLにフォーカスする理由

管理人は、「画像認識・コンピュータビジョン全般」(CV)と「機械学習・深層学習(の応用)」(ML)を主な専門分野として研究興味としており,素直にそれらのCVとMLの情報を提供するサイト構成としているのが素直な理由である.このCVMLについては,ブログの「機械学習とかコンピュータビジョンとか」さんのタイトルにならって,「CV」と「ML」で組み合わせた(ただし,私のサイトは,基礎研究的な機械学習の話はそれほど取りあげない.応用寄りである).

4.1 動機

以前から,ビジョン系および深層学習・機械学習周辺の研究コミュニティでは,身につけておきたい基礎的な内容が膨大であって,非常に辛いという問題を抱えている.それら基礎教養の全てを知る必要は必ずしもなくとも,ビジョン系の学会では細分化されず,それらの全ての内容が1つのコンピュータビジョン会議に集結するので,なんとなくでも各項目について知っておいた方が見聞は広まるしアイデアも出てくる.広くアンテナが張れるようになれば,「あの人の技術や研究能力を頼りたい」と思うことも出てきて,その人に共同研究や共同開発をお願いしに行けるようにもなる.

深層学習ブーム以降,その「浅くても良いので知っておく法がよい基礎知識量」の雪だるま的な膨大化傾向が,更に加速していると感じる.深層学習は,その「モジュール結合の容易性」により,マルチモーダルやマルチタスク学習の容易さも増した.しかし,それは近隣分野との融合研究の増加にもつながたので,各分野間の境界領域では問題設定が混ざったり,過去の2分野以上の問題を合わせて解くことも多い(Vision and Language や text2speech など).更に,どの問題に対しても強い「Transformer,BERT」などの登場で,尚更のことパターン認識系の各分野間の垣根がなくなりつつある.

そうした中で,コンピュータビジョンと深層学習時代の標準的内容をこのサイトで日本語でWiki的構造でなおかつ,重要なところをかいつまんで早く知るガイドマップを提供できれば,今後皆様にかなりに役に立つサイトとなっていくはずと考えて,このサイトをCV,MLをターゲットに立ち上げた.

ただし,授業スライドやWeb動画講義のようなシーケンシャルな書籍的階層構造と,私のWiki的構造のこのサイトでは果たす役割や効能は違うので,両者の使い分けには注意されたい.テキスト・書籍や講義も,良いところが当然ある.一方で,このサイトは今後数十年貯めて増やしていく予定であるし,WikipediaなどのWiki構造辞書サイトと同じく,各記事もどんどん動的にアップデートさせられる「更新可能である強み」を持つ点が,動画講義や書籍とは,一番性質が異なる点である.動画講座や書籍は,版を重ねるまで固定化してしまう.

4.2『日本語で』わかりやすく良質な,知識・考え方を届けたい.

かつて「コンピュータビジョンのセカイ」をマイナビ様に連載提案をした頃から,私の一貫しているコンピュータビジョン情報発信の動機がある.それは「英語圏のWebでは大量にコンピュータサイエンスの情報があるが,日本語にはそういった情報源が少ない」という動機である.既に削除した,前身のブログも同じ動機であった.

また,すっかりコンピュータサイエンスで米国の次の二番手になった中国圏でも,現在では知乎(zhihu)を中心に,洗練されたコンピュータサイエンスの情報が中国語で大量に出回っている.そうした中,日本語での情報提供は皆様にもぜひ頑張っていただきたいので,そう主張するのであればまず自らも行動で示していきたいというのが,このサイトを(2019年に)新設した理由の1つでもある.

本サイトは,それぞれの記事では触りの部分だけしか述べていないものの,1つのサイト内でwiki的に関連性を見やすく構成しているつもりである.従って,初学者の方だけではなく,同世代や,私より上の世代の先生方にも「俯瞰」「整理関連付」「アイデア出しの元」などの面で,お役に立てるサイトとして,下支え役として貢献できると幸いである.

知能的・機械的なタスクを人間以外に任せることが加速的に進んでいる現在,(それでも)働きたい人にとって大事なのは,入力(分析力・破棄力)と出力(創造力・設計力)の質である.良いものを取り入れて,そこから良いものを出せることができるのが次世代のプロフェッショナルである.

そのために,情報の大海に溺れずに,自分自身に特有の探求先に強くフォーカスできるように,ぜひ,このガイドマップとしてこのサイトを長く有効活用していただきたい(みなさんも,短い時間でも良いので,自分自身で発信して出力の練習も行っていくことが大切であることも付け加えておく).

また,自身のフォーカスしているところ以外の見聞を増やす際にも,それこそ「旅行ガイドブック」を見るときと同じように,このサイトを楽しみながら読んで頂ければと思う.この際とは,CVとMLが好きな人向けの面白くて楽しい,自分も旅に出たくなってくる地図であることも,こころがけたい.著者自身も,観光地や,家の近くの京都に遊びに行ってまわるときに,そうしたガイドマップを片手に歩くのが好きであり,このサイトも「探索心を掻き立てる観光ガイドマップ」として発展させていきたい.

アフィリエイトプログラムの使用

当サイト「CVMLエキスパートガイド」は、amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである、 Amazonアソシエイト・プログラムの参加者です。

↓ ためになった方は,記事をSNSでシェアをしてくださると,管理人の記事執筆モチベーションが上がります