このサイトと著者について

1. 概要

本サイト「CVMLエキスパートガイド」は,コンピュータビジョン(CV: Computer Vision),画像認識や機械学習 (ML: Machine Learning)界隈の研究者向けに,「用語解説」記事を中心に,ガイドブック的にそれらを整理して提供するサイトである.このサイトの著者は,画像認識・コンピュータビジョン研究者の Masaki Hayashi である.著者は,博士課程進学以降 Computer Visionの中でも,人物認識や動画認識を主に研究してきた研究者である.

本サイトの全ての内容,記事中のテキストおよび(自作した)画像の著作権は,全て著者である私,Masaki Hayashi に帰属するものとする.

サイト名に「エキスパート(向け)ガイド」と銘打ってある通り,関連分野全体のガイド地図として,画像系界隈の研究を全体的に俯瞰したり,教科書のように各用語の関係性をWeb上で眺められるサイトの構築を,このサイトの目標としている(詳しくは2節).

また,各記事では,その技術や話題の「歴史」「経緯」も記述することを重視するようにしている.各技術の流れを知ったり,普段からその癖をつけて考えることにより,皆様の研究開発が,更に知的で楽しい活動となることや,歴史に強い後進の研究者を増やすことも狙っていきたい.

とはいえ,これまでのところ,業務外でゆっくりこつこつ書いているサイトである.従って,ある程度の記事数になって,SEO検索上位になり,PV数もある程度高い状態にサイトが成長するまでは,なかなか上記のような貢献はできないかもしれないが.

2. サイトの「目的 」とその背景

総合的なガイドとして教科書的な情報を集約しておき,ユーザーである研究者もしくは研究者見習いの学生の方々が,日常的に便利に利用できる「情報集約サイトの構築」を通して「専門が近い研究開発者の方々への,学習および研究活動の支援」を行うことが目的である.

このサイトは,エキスパートガイドという名前の通り「観光地ガイド」のような役割に徹したい.このサイトは,旅行ガイドブック程度の簡潔さを持ち,そのなかで名所(押さえておきたい標準的な内容)の網羅をおこなう.

つまりは,このサイトの各記事が簡易的な各項目への導入や,それらの要所となる項目同士の関連づけの紹介となっている.繰り返しこのサイトを使用していただくことで,その関連性が,階層的・グラフ的サイト構造を通して自然と身につくことが,著者が最も狙っていることである.

論文や専門書それぞれにリーチする前にも「この技術やこの論文だけは最低限,プロなら押さえておきましょう」という標準的内容を本サイト内だけで辿れる.Wikipedia的な集約サイトを構築したい.

これにより,皆様にとって重要な論文にたどり着き,しかもその概要は得た上で,深く自分で読み解き考えられるガイドとなれば幸いである.(ただし,私1人で執筆しているサイトなので,5年くらい経過しないと,たいした網羅度にはならないかもしれないが).

ただし,あくまでガイドなので,研究のスピードアップと効率化や辞書目的にだけ使っていただきたいと思う(教科書のよう,このサイト全部を読んでいただくことも意図していない).2次情報だけに頼ることは良くないので,なるべく避けてもらいたい.1次情報である論文をきちんと自分で読むだけでなく,自分で論文を書いたり,周りの同僚と議論したり,実際に業務で研究を行ったりする中で,必ずご自身の頭と体を使って身につけて頂きたいのが願いである.そして,基礎が手っ取り早く早く身についたら,自分の軸を大切にして,これまでの常識や枠をはみ出すことを心がけていただきたい.(

ちなみに私は,「基礎の定着は飛ばして,即実践にはいる方が大事である」と思っている.研究をはじめたてのころは,まず自分で研究のプロセスを一通り踏むことが大事であり,基礎はプロになるまでに習得していけばよい.なぜなら初級~中級では,知識の本質をつかんだり,型の意味を咀嚼することは無理だからである.基礎から積み上げる方法は,よっぽど時間が豊富にある人ならやってもいいが,無理があるのも理由である(だからこそ,学習内容が膨大なCVML分野の皆さんの一助にもなればと思い,このガイドサイトを立ち上げたわけでもある).

著者は,若手のフェーズを終えたのち中間管理職生活も長くなってきており,学会の委員なども経験するなど中堅研究者に足を踏み入れている.また,企業の研究コンサル経験が多く,ベンチャーでの要職を経験したことで,幸い,若くしてマネジメントや人事,教育にも詳しくなることができた.その道中は,当然失敗も多かったが,着実に成長してきたつもりである.

それもあって,本サイトも,大学の「授業スライド」や「教科書」を書くつもりで,各記事を執筆している.将来的には,このサイトのような教材的な自学自習マテリアルの執筆に加えて,アドバイス業や,コーチングの仕事も増やしていきたい.

3. コンピュータビジョンと機械学習にフォーカスする理由

管理人は、「画像認識・コンピュータビジョン全般」(CV)と「機械学習・深層学習(の応用)」(ML)を主な専門分野として研究興味としており,素直にそれらのCVとMLの情報を提供するサイト構成としているのが素直な理由である.このCVMLについては,ブログの「機械学習とかコンピュータビジョンとか」さんのタイトルにならって,「CV」と「ML」で組み合わせた(ただし,私のサイトは,基礎研究的な機械学習の話はそれほど取りあげない.応用寄りである).

以前から,ビジョン系および深層学習・機械学習周辺の研究コミュニティでは,身につけておきたい基礎的な内容が膨大であって辛いという問題を抱えている.それら基礎教養の全てを知る必要は必ずしもなくとも,ビジョン系の学会では細分化されず,それらの全ての内容が1つのコンピュータビジョン会議に集結するので,なんとなくでも各項目について知っておいた方が見聞は広まる.

深層学習ブーム以降,その知っておくとよい基礎が膨大化する傾向が更に加速している.深層学習の「モジュール結合の容易性」により,マルチモーダルやマルチタスク学習の容易さが増した.これにより近隣分野との融合研究の増加にもつながり,各分野間の境界領域では問題設定が混ざったり,過去の2分野を2つ合わせて解くことも多い(Vision and Language や text2speech など).更に,どの問題に対しても強い「Transformer」の登場などで,尚更分野間の垣根もなくなりつつある.そうした中で,コンピュータビジョンと深層学習時代の標準的内容だけでもこのサイトで日本語でWiki的構造で提供できれば,かなり今後皆様にお役に立つサイトになっていくと考えている.授業スライドやWeb動画講義のようなシーケンシャルな書籍的階層構造と,私のWiki的構造のこのサイトでは果たす役割や効能は違うので,両者の使い分けには注意されたい.

かつて「コンピュータビジョンのセカイ」をマイナビ様に連載の提案をしたころから,私の一貫しているコンピュータビジョン情報発信の動機がある.それは,「英語圏のWebでは大量にコンピュータサイエンスの情報があるが,日本語にはそういった情報源が少ない」という動機である.また,すっかりコンピュータサイエンスですっかり米国の次の二番手になった中国圏にも,大量にWeb上に高度なコンピュータサイエンスの情報が出回っている.日本語での情報提供は皆様にもぜひ頑張っていただきたいので,そう主張するのであればまず私自身からまず行動で示していきたいというのがこのサイトを新設した理由である.

本サイトは,それぞれの記事では触りの部分だけまでしか述べていないものの,1つのサイト内でwiki的に関連性を見やすく構成しているので,初学者の方だけではなく,同世代や,私より上の世代の先生方にも「俯瞰」「整理関連付」「アイデア出しの元」などの面で,少しでもお役に立てるサイトとして,下支え役として貢献できると幸いである.

4. 記事のカテゴリー分類

このサイトは「10年後もあまり情報の価値が廃れることのなく、かつ大学教員が提供するような専門性の高い情報の提供」にフォーカスしたい.そもそも,将来的には教科書を書いたり,Webで動画コースも提供していきたいのであるが,情報の関連性や集約性を一番良くできるのはWebページであると,サイト解説時に感じたので,Webサイトとして提供することとしている.

そうはいっても,私も本業の隙間でこのサイトをコツコツ書くことしかできないので,基本的な用語の記事が埋まるだけでも結構な年月は必要だと予想している.(もし本サイトの構築活動に対して,広告出稿などで,ご支援いただける企業・個人などがいらしたら,お声がけをして頂けると非常に助かる).

本サイトでは,以下の「記事カテゴリ」に大きく分類して記事を投稿し,研究者向けの各種情報をガイドする(上部ツールバーから,各カテゴリーのトップ記事へアクセスできる):

  • 用語辞典 (全記事リスト):コンピュータビジョンと機械学習/画像認識における専門用語の記事を増やしていき,本サイト内で簡易Wiki化を行う.記事中で紹介した用語が紹介されているWikipediaページ/書籍/論文も記事に関連情報として添えて,詳しいところはあくまで自学してもらうようにしたい(本サイトは前述の通りあくまでガイドブックに徹したいので,深入りはこのサイトでは行わない).逆に言うと,Wikipediaの記事などと同じで詳細は省いた簡潔な用語解説で構成されるはずで,リファレンスとしての質は他にはないものを目指したい(詳細さより,私が持ってる独自の視点を盛り込むことを重視).私が,このサイトで遅筆ながらも今後,コツコツ用語解説の記事を書くことで,英語圏でのMediumや中国のZhihuなどで見られるような,「博士を持った方や研究に詳しい方が,質の高い研究解説記事を沢山書いている状況」を,日本でも起こせる一助となれば幸いである.
  • ソフトウェア (2021年6月スタート): 以前はOpenCVかMatlabあたりに詳しいことが,うちの分野の研究開発者には大事な点だった.それが,近年は PyTorch や Tensorflowなどのディープラーニング向けライブラリに習熟する必要があり,更にその中でも主要なソフトウェアや手法の構築方法を押さえておくことも大事である (例えばSSDを自作しなさい,など).各ライブラリのチュートリアルや細かい話までは,書籍やWebコースなどに任せるとして,本サイトでもそれら主要ライブラリの概要とリスト化を行って,各ライブラリの基本情報を一挙におさえられるようにしていきたい.
  • おすすめ書籍紹介:大学院生向けの教科書や,研究者向け専門書を厳選したものを紹介する.また,研究者や管理職としての働き方を学ぶためのおすすめ書籍も紹介していきたい.(ライティング術や,計画スケジューリング系の書籍,コーチングテクニックや管理職向け書籍など).
  • コラム記事
    • Q & A記事 (2021年6月スタート):英語圏では Quora や Reddit のようなところで,互助的に高度な意見交換や議論が活発に行われている一方で,日本にはオープンなWeb上にはそういう深い議論が交わされる場所が形成できていない.勉強会文化はあるものの,他人の論文を読んで内容を共有する講義形式のものが主流なので,インタラクティブ性やワークショップ性には欠けている.とりあえず私個人でこのサイトで勝手に疑問や問いを考えて,それに自分で答えるQ&A記事を,細々と書いていくことにした.(要するに,自問自答記事である)

アフィリエイトプログラムの使用

当サイト「CVMLエキスパートガイド」は、amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである、 Amazonアソシエイト・プログラムの参加者です。