About | サイトと管理人について

1. サイトの概要ときっかけ・動機

CVMLエキスパートガイドは,コンピュータビジョン(Computer Vision, CV)と機械学習(Machine Learning, ML) を中心テーマとしたページです.当サイトは,ガイドマップ型構造により,中級者以上の探求力向上のサポートを主目的にしています.

CVを使用される(初心者を脱して以降の)中級者層以上の仕事で方々を,主なターゲットとして,研究開発に取り組む際の「探究能力の向上」や,「探索的・思索的な日常生活の行動・方法」向上を,強力に後方支援いたします.

本サイトの運営を通して,CV業界や周辺業界の皆様を長期的にご支援し,中間層のパワーアップをもたらすことが私の狙いです(2.2.1節).その目的を達成するために,[用語集 📚 × コラム💡]の,主要2カテゴリから構成されるサイト設計にしています (1.1節).皆様が習い事に通って,コーチについてもらっているかのように,このサイトを通して,皆様の能力向上や,普段の行動のコーチングを支援していくサイトです.

このサイトの継続的な使用を通じて,(おさえておきたい) 標準的技術の習熟を進められるように,用語集を通じて「標準的知識集約サイト関連する外部の論文・情報へのハブサイト」の役割も提供します.また,コラムを通して,普段の行動計画力や,アイデア出し力(検索機能や論文キーワード),疑問力(Q&A)・批評力も向上していくようにしています.

日々の拠点サイト,ベースキャンプ毎日通うカフェ☕️のように,毎日ブラウザ上に開いてサイトを活用して頂くと,探究的な皆様の研究生活が,日々成長を感じる,より充実したものにバージョンアップされるはずです.

初めてこのページ・サイトにお越しになった方は,「説明書ページ」や「更なる活用法の紹介」に相当する,以下のページも参考にしてください:

このサイトの管理人および記事執筆は,コンピュータビジョンを専門とする Masaki Hayashi (研究者個人ページ) がおこなっています.私は,研究ディレクター・研究コーチ業(企業向け)や,このサイトなどの学習マテリアル作成を,仕事としています.

このサイトをよく使う方は,Twitterアカウント(@cvml_eg)もフォローすることをお薦めします.サイトではあまり書かない最近の研究についての話題や,コラムのような仕事法・研究法・ビジネスについての話もTwitterで行います:

1.1節以降で,詳細を述べていく前に,最初に一番大事な「著作権」について書いておきます:

本サイトの全ての内容,記事中のテキストおよび(自作した)画像等の著作権は,全て著者である私,Masaki Hayashi に帰属するものとします.

一人でも多くの方が,このガイドマップ型サイトを有効活用して,レベルアップしていただき,新たな主役・トッププロと活躍して頂くことを願います.業界をともに盛り上げていきましょう.

このサイトと管理人の私は,その皆様型の一番下で働いて後押しする,下支え役・引き立て役でありたいです.

1.1 記事カテゴリーの全リスト

ここでは,以下に全カテゴリーのリンクと役割を列挙するかたちで,[用語集 📚 × コラム💡]を中心としたサイトの構造を提示します:

1.2 主要2内容「用語集 × コラム」

日常の研究開発(=旅)における探究活動を「もっと楽しい旅にするガイド」として,本サイトを旅行時にに小脇に挟んでいる感覚で活用していただけると嬉しいです.

[用語集 📚 × コラム💡] の記事群を通して,コンピュータビジョンやその周辺技術の専門家の「探究活動」の充実と向上を,日常的にサポートします:

  • 用語集 📚 :知識獲得・探索拠点
    • ガイド地図=Wiki教科書を融
    • [全体(global)] 技術間の関連性を重視した用語解説のWiki
      • サイト構造から,用語間の階層ツリーや分類が分かる
      • Wikiリンクで関連用語に遷移でき,関係を身に付けやすい
    • [各記事(local)] 教科書レベルの日本語解説を構造的な記事で提供
      • 論文のように、記事内も階層構造化(長い文章に慣れる).
      • 図解理解もしやすいように「独自に描いた,カラフルでわかりやすい図」も提供.
  • コラム 💡:知恵行動の向上方法を提供
    • 行う・考える・議論する力の向上を重視したコラム記事群
    • 研究論文の探索方法(検索キーワード)や,サーベイ・アイデア出し.
    • 手段・思考能力向上を支援:行動の仕方や,疑問の持ち所(Q&A)など
    • 独自性の確保方法取得を支援:自分で深く考える・比較方法(Q&A)など
    • センスや感性の向上を助けるコラム群.

これら2つのコンテンツを,日常的に使用・探索・復習しながら,研究開発していただくことで,読者の皆様の実力が,自然と向上していく事をねらっている設計です.

とりわけ,技術間の関連性を,サイト全体の構造を通して自然と皆様に提供します.それにより,旅行ガイド本や,趣味・スポーツ別の攻略本のように学習・復習や,研究のアイデア出しの能力向上を助ける.それにより,日本の中間層全体のパワーアップの実現が,本サイトの1番狙いです(2節).

また「3. おすすめ書籍」「4. ソフトウェア」の各カテゴリでも,役に立つ情報を提供します.

1.1.1 用語集 → 標準的技術のWikiの提供と,その洗練や外部リソースへの連携

用語集」では,Wiki × テキストを狙っており,以下の価値を提供します:

  • グローバルなサイト全体の構造や,ページ間の関係を通して,地図や年表(歴史)として全体図を俯瞰できるようにします.
  • ローカルな各記事レベルでは,教科書・テキスト書籍のように,各用語の詳細と関係性を紹介します.

つまりは,全体 (Wiki構造と記事間・単語間のハイパーリンク) 局所 (各記事の,テキストレベルでの解説・図説とページ構造)の,両方の質の高さと相乗効果に気を配った用語集を構築しています.

1.1.2 コラム → 自分で探し,考え,疑問を発見し,応用する力を伸ばす

コラム」では,中級者が必要な標準的な考え方やノウハウ,思考法や研究戦術などを提供します.用語集は知識重視なのに対して,コラムは,知恵行動指針などの「思考する」「行動する」力の向上を重視しています.

2. サイトの狙いとターゲット層

2.1 エキスパート向けガイドとは?

サイト名に「エキスパート(向け)ガイド」と入れてある通り,このサイトは,ガイドマップ(地図) のような構造・構成を意識しています.たとえば,観光地に持っていく「るるぶ」や「地球の歩き方」のような役割や,現地ガイドやバスガイドのような「楽しませながらガイドする」役割を目指しています.

つまりは, 読者が旅の主役となって,楽しく目的もある旅を続けるためのガイド本・観光ガイド」を提供したいのが管理人の動機です..ということで,毎日のみなさまの研究開発活動が「面白く・より探究的になる」ことを意識しています (サイトをブラブラと探索するだけでも楽しいはずです).

また,能力向上を狙っているので,趣味やスポーツやゲーム向けの「攻略本」「How to 本」や「戦術指南本」の役割も意識しています.実応用での勘所や,各タスクごとの記事(=応用の仕方) の提供も重視することで,どう使うかどう分析するかなどの「各知識の関係をもとに,どう実際に使うか・考えるか」の,知恵・ノウハウの向上も,大切にしています.

2.2 管理人の狙い:多くの中級層への徹底的な支援

当サイトでは,2カテゴリでそれぞれ以下の点に注力します:

  1. 用語集📚:教科書・テキストにまとめるような標準的技術の習得・洗練の支援.
  2. コラム💡:研究における探究手段や,行動方法など思考面・行動面の能力向上の支援.

逆に,PyTorchやHuggingFaceの使い方などの実装面については,テキスト書籍も多く発売されており,私以外にも書ける人が多いで,詳しくはこのサイトでは書きません.ただ,「探索力向上重視」の幸男あるので,ソフトウェア でかいつまんでは,まとめて,サイト外部の資料に辿りやすくはしておきます).

私は,既にSSIIで学会の企画職も経験しており,ベンチャー創業期の経験もあります.また,中間管理職や役員経験も,年齢の割には多く,トップレベルの研究者(学生)の育成にも成功してきました.つまりは,ビジネス経験・研究開発経験の両方ともに,中堅〜準ベテランのキャリアである私だからこそ可能な「研究・ビジネス両面におけるハイブリッドな価値」の提供に集中したいです.

従って,俯瞰度も抽象度も高めの「アカデミックな話」と「ビジネスを意識した技術の話」や,「応用力の強化につながる話」などの提供にも,ゆくゆくは集中したいです.とはいえサイトに人が集まらないと話にならないので,まずは技術テキストである「用語集」の充実からはじめて,アクセス数の確保から始めます.

また,このサイトでは,コンピュータビジョンの体系化にも注力しています.体系的な知識やノウハウの習得に結びつくように用語集はWiki化して階層構造化+Wikiリンクで関連付けしており,それと連携が強くなるようにコラムの各カテゴリも展開することを意識しています.

2.2.1 著者の昔から一貫したターゲットでもある「中間層の充実」

昔から一貫している,私のコンピュータビジョン業界への達成目標は『日本の中間層の充実(プロ,アマ限らず)』である.「中間層を分厚くして,主人公を増やすこと」が,私の一貫した狙いです.

もちろん,私もまだまだ学び,経験しないとならないことが多いので,皆さまと一緒に更に成長できれば幸いです.ただキャリアが積まれてきた私から,初級者を脱して中級になりたての方々には,提供できる価値は多いと思うので,先人から学んだことを,みなさまに少しずつ還元できればと思います.

3.サイトの特徴と利点

管理人なりに,このサイトの特徴と利点(ウリ)をまとめるならば,以下のような点があると思います:

  1. 毎日使うだけで「探求力」が上達する設計
  2. 歴史・経緯の重視
  3. 実用力・ビジネス応用力も重視
  4. 管理人独自の分析・Tips

以下の子ページに,これらの利点と特徴について詳しく述べてあるので,より詳しくは,そちらを参考にされたい:

4. 「日本語サイト」で提供する理由

管理人は「画像認識・コンピュータビジョン全般」(CV)と「機械学習・深層学習(の特に実応用)」(ML)を,主な研究興味とし,なおかつビジネス専門分野としています.よって,素直にそれらのCVとMLを主テーマとするサイト構成にしました.

※「CVML」という組み合わせについては,ブログの「機械学習とかコンピュータビジョンとか」さんのタイトルにならって,この組み合わせを選んでいます

4.1 「学ぶべき標準的技術が多すぎる」の現状を打破したい

以前から,ビジョン系および深層学習・機械学習周辺の研究コミュニティでは,身につけておきたい標準的技術が膨大になってきており,効率良くそれらを身に付けないとスタートラインにも立てず,非常に辛いという問題を抱えていると感じています.

それら基礎教養の全てを知る必要は必ずしもないです.しかし,ビジョン系の学会では細分化されて学会が開催はされず,全ての内容が1つのコンピュータビジョン会議に集結しています.よって,各項目について知っておいた方が見聞は広まるしアイデアも出てきますし,自分が得意なところ以外も広くアンテナが張れるようになれば,「あの人の技術や研究能力を頼りたい」と思うことも出てきて,その人に共同研究や共同開発をお願いしに行きやすくもなります.

※ もちろんそんな状況でも,広く知ることはやめて,「深く狭く攻める」のも戦略の1つです.

4.1.1 境界線のなさや,分野間融合の進展

深層学習ブーム以降,その「浅くても良いので知っておく方がよい基礎知識量」の雪だるま的な膨大化が,更に加速しています.深層学習は,その「モジュール結合の容易性」により,マルチモーダルやマルチタスク学習の容易さも増しています.それは,近隣分野との融合研究の増加にもつながりました.それにより,各分野間の境界領域では問題設定が混ざったり,過去の2分野以上の問題を合わせて解くことも多いです(Vision-Language や text2speech など).更に,どの問題に対しても通用するTransformerの登場で,以前より更にパターン認識系の各分野間の垣根がなくなりつつあります.

そうした中で,コンピュータビジョンと深層学習時代の標準的内容をこのサイトで日本語でWiki的構造として提供し,なおかつ重要な標準技術項目のみについて深く学べて検索もできるガイドマップを提供できれば,今後,長期的に20年~30年皆様に役に立つサイトを構築していけるはずだと考えました(2019年のサイト開設時点).これが,本サイトをCV,MLをターゲットにして,立ち上げた理由です.

4.2『日本語で』なだけでなく『良質な日本語記事』を届けたい.

かつて「コンピュータビジョンのセカイ」を,マイナビに連載提案をした頃から,私の一貫しているコンピュータビジョン情報発信の動機があります.それは「英語圏のWebでは大量にコンピュータサイエンスの情報があるが,日本語にはそういった情報源が少ない」という動機です.

このサイトの前身の「DERiVEコンピュータビジョンブログ(※ 既に削除済み)」も,同じ動機でした.ただし,博士号取得前である当時の私は,まだ技術的にもキャリア的にも未熟であったので,今ほど高レベルの内容を提供できませんでした.

コンピュータサイエンスにおいて,すっかり米国の次の2番手になった中国圏でも,現在では知乎(zhihu)などのサイトを中心に,洗練された情報が中国語で大量に出回っています.英語圏にもRedditに,大量のディープラーニング系の充実した議論が行われているスレッドがあります.しかし,日本語圏には,そうしたハイレベルな情報発信基地が,ネット上には存在しないのが現状です(ここの研究者がスライドは出していますが).そうした中,「日本語での情報提供」は私だけでなく,皆様にもぜひ頑張っていただきたいです.主張するのであれば,まず自らも行動で示したいというのが,このサイトを開設した理由の1つでもあります (2019年 開設).

知能的・機械的なタスクを人間以外に任せることが加速的に進んでいる現在,(それでも)働きたい人にとって大事なのは,「入力(分析力・破棄力)」と「出力(創造力・設計力)」の質であります.良いものを取り入れて,そこから良いものを出せることができるのが,次世代のプロフェッショナルです.創造性がない「機械的作業」は,徐々にロボットに任せて,人間はロボットができない抽象度の高い仕事や,器用な手先の仕事を担当する時代になってきています.

そんな時代の中で,情報の大海に溺れずに,自分自身に特有の探求先に強くフォーカスできるように,ぜひ,このガイドマップとしてこのサイトを長く有効活用していただきたいと思います.

当然ながら,(短い時間でも良いので),自分自身でWebで発信して,出力も積極的に行っていくことが大切です.このサイトは,授業的な「私→みなさん」単一方向的ではなく,Wikiやコラム群など,探索的で能動的に自分の興味に従って自分で探索して頂く,「探究活動の拠点基地」として,皆様にお役に立てることを意識して設計したつもりです.

最後に,繰り返しになるが改めて強調しておきます.このサイトは,CVとMLが好きな人向けの面白くて楽しい,自分も旅に出たくなるような地図であることを意識しています.著者自身も,観光地や,家の近くにある京都に遊びに出まわるときに,そうしたガイドマップを片手に歩くのが好きで,その発想がからインスパイアされたのがガイドブック的なこのサイトのサイト構造です.このサイトも,旅行ガイドのように「探索心を掻き立てる観光ガイドマップとして,十年単位で時間をかけて,発展させていきたいと思います.

アフィリエイトプログラムの使用

当サイト「CVMLエキスパートガイド」は、amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである、 Amazonアソシエイト・プログラムの参加者です。