1. サイトの概要ときっかけ・動機
CVMLエキスパートガイドは,コンピュータビジョン(Computer Vision, CV)と機械学習(Machine Learning, ML) を中心テーマとしたページです.当サイトは,ガイドマップ型構造により,中級者以上の探求力向上のサポートを主目的にしています.
CVを使用される(初心者を脱して以降の)中級者層以上の仕事で方々を,主なターゲットとして,研究開発に取り組む際の「探究能力の向上」や,「探索的・思索的な日常生活の行動・方法」向上を,私のほうで強力に後方支援(=サポート・コーチ・相談)いたします.
初めてこのサイトにお越しになった方は,以下の説明書ページだけ読むと,すぐに使用(と活用)を開始できます:
このサイトの管理人および記事執筆は,コンピュータビジョン/Vision-Language(特に動画処理と人物理解系の処理)を専門としている Masaki Hayashi (研究者個人ページ) がおこなっています.アラフォーの博士号持ちの研究者ですが,このサイトの推進以外にも,研究ディレクター・研究開発コーチ業(企業向け)などを,仕事としています(より詳しくは以下のページで).
この後,1.1節以降で詳しい話に入る前に,一番大事な「このサイトの著作権」について書いておきます:
本サイトの全ての内容,記事中のテキストおよび(自作した)画像等の著作権は,全て著者である私,Masaki Hayashi に帰属するものとします.テキストや画像の無断転載は禁止です(引用の範囲を超えない,少量の文書引用であれば当然問題ありません).
[2033年3月27日.以下ツイートを参考にして追加] また,サイト中の文字や図表を,機械学習モデルへの学習データとして利用することを禁止します.同時に,スクレイピング後に加工して改変して学習データ化することも禁止します
イラストレーターのみならず、文筆、造形、写真、音声、音楽、縫製、その他作品のデジタルデータ化が可能な創作活動をする方にお願いします。
— 高橋しょうご (@Shogo_tkhs) March 27, 2023
AIへの無断利用、学習データ化を禁じると、転載禁止等の注意書きやプロフィールに追加なさってください。
AIは作品と作者の「技法」を擬似的に模倣します。
1.1 サイト内・サイト外の両方とも「探求」しやすい設計
当サイトでは,まず第一に「探索・検索しやすい設計」にこだわったサイト構造にしてしています .その理由は,ユーザーによる自立的な学習・探求を重視するためです:
《サイト内での探求》 | 《サイト外への探求》 |
「wiki構造での体系的知識化」につてとめています(特に用語集). | 「論文・指定参考書・良い記事」へのリンク・参照設置につとめています. |
1.2 このサイトの概要
本サイトの運営を通しての私の狙いは,CV業界や周辺業界の皆様を長期的にご支援し,中間層のパワーアップをもたらすことです(2.2.1節).その目的を達成するために,[用語集 📚 × コラム💡]の,主要2面構造のサイトにしています(1.3節).
このサイトの継続的な使用を通じて 標準的スキルの成長・習熟を進められるように,用語集なソフトウェア,おすすめ書籍などを通じて「標準的知識集約サイト」+「外部の論文・情報への拠点サイト」の役割も提供します.また,コラムを通して,普段の行動計画力や,アイデア出し力(検索機能や論文キーワード),疑問力(Q&A)・批評力も向上していくようにしています.
日々の拠点サイト,ベースキャンプ⛺毎日通うカフェ☕️のように,毎日ブラウザ上に開いて,このサイトを活用して頂くと,毎日の生活が日々成長を感じる,より充実したものにバージョンアップされるはずです.
Twitterアカウント(@cvml_eg)のフォローもお薦めします.サイトではあまり書かない「最近の研究についての話題」や,コラム💡記事のような、「仕事法・研究法・ビジネスについての話」もTwitterで行っています.用語集📚の復習にもなると思うので,Twitterアカウントも活用してください.
一人でも多くの方が,このガイドマップ型サイトを有効活用して,レベルアップしていただき,新たな主役として活躍して頂くことを願います.業界をともに盛り上げていきましょう.
1.3 記事カテゴリーの全リスト
ここでは,以下に全カテゴリーのリンクと役割を列挙するかたちで,[用語集 📚 × コラム💡]を中心としたサイトの構造を提示します:
![CVMLエキスパートガイドの全体構造[2面構造] | CVMLエキスパートガイド CVMLエキスパートガイドの全体構造[2面構造]](https://cvml-expertguide.net/wp-content/uploads/2023/03/8d35d4463f1215d41c623c49288c7314.png)
主要なトップページへの一覧をしめします:
- 用語集📚 [for 知識の向上]
- コラム💡 [for 知恵 の向上]
- ❓Q & A記事 (2021年6月スタート)
- 🔍CVML論文の検索キーワード(2021年11月スタート)
- 🌴働く環境を整える(2023年2月スタート)
- おすすめ書籍 📖
- コンピュータビジョン・ディープラーニングのおすすめ書籍 (CV, DL books)
- 機械学習のおすすめ書籍 (ML books)
- 研究術・学習術のおすすめ書籍
- ソフトウェア (2021年6月スタート)
- 検索専用ページ (2022年3月スタート):記事数の増加に伴い,専用ページを設置開始:
1.4 主要2内容「用語集 × コラム」
日常の研究開発(=旅)における探究活動を「もっと楽しい旅にするガイド」として,本サイトを旅行時にに小脇に挟んでいる感覚で活用していただけると嬉しいです.
[用語集 📚 × コラム💡] の記事群を通して,コンピュータビジョンやその周辺技術の専門家の「探究活動」の充実と向上を,日常的にサポートします:
- 用語集 📚 :知識の獲得・探索拠点 (Wiki 教科書を融合)
- [全体Wiki] 技術間の関連性を重視した用語解説のWiki
- 階層や分類がわかる
- 用語の関係を身に付けやすい
- [各記事] 教科書レベルの解説を構造的記事で提供.
- 記事内も階層的に構造化.
- 資格理解もしやすいように「わかりやすい図」も提供.
- [全体Wiki] 技術間の関連性を重視した用語解説のWiki
これら2つのコンテンツを,日常的に使用・探索・復習しながら,研究開発していただくことで,読者の皆様の実力が,自然と向上していく事をねらっている設計です.この2面構造サイトを日常的に使用 していただくことで,ユーザーの方が,[知識 × 知恵] の両どりを狙えるようにしました.
本妻とは,技術間の関連性を,サイト全体構造を通して自然と皆様に提供していることが特徴です.それにより,旅行ガイド本や,趣味・スポーツ別の攻略本のように学習・復習や,研究のアイデア出しの能力向上を助ける.それにより,日本の中間層全体のパワーアップの実現が,本サイトの1番狙いです(2節).
以下の表に,「狙いと利点」についてまとめます:
用語集📚(知識の向上) | コラム💡(知恵の向上) | |
目的 | 体系的に標準的技術を習得・洗練. | 思考・行動(標準的方法)の向上. |
手段 | 用語解説ページで構成されたWiki | コラム記事をカテゴリに分けて提供 |
狙い 利点 | 用語同士の関係性が,(自然と)身に付く. CV全体に対する俯瞰度が上がる. 効率良く(階層的に/用語で)検索が可能. おすすめ書籍との連動で,高い学習効果 元論文や外部記事にも素早くリーチ. | プロの考え方がわかる. センス・批評力が向上 自分で解釈・判断できるように. 環境構築・育成能力が上がる. ビジネス価値にも敏感になる. |
また「3. おすすめ書籍」「4. ソフトウェア」の各カテゴリでも,役に立つ情報を提供します.
2. サイトの狙いとターゲット層
2.1 エキスパート「ガイド」とは?
サイト名に「エキスパート(向け)ガイド」と入れてあるように,このサイトでは,ガイドマップ(地図) のような構造・構成による「ガイド機能」の役割を提供することを意識しています.たとえば,観光地に持っていく「るるぶ」や「地球の歩き方」のような役割や,現地ガイドやバスガイドのような「楽しませながらガイドする」役割を目指しています.つまりは, 読者が旅の主役となって,楽しく目的もある旅を続けるための「ガイド本・観光ガイド」を提供したいのが管理人の動機です.もっと言うと,毎日のみなさまの研究開発活動が「面白く・より探究的になる」ことも,意識しています (サイトをブラブラと探索するだけでも楽しくなるように).
また,能力向上を狙っているので,趣味やスポーツやゲーム向けの「攻略本」「How to 本」や「戦術指南本」の役割も意識しています.実応用での勘所や,各タスクごとの記事(=応用の仕方) の提供も重視することで,どう使うか,どう分析するかなどの「各知識の関係をもとに,どう実際に使うか・考えるか」の,知恵・ノウハウの向上も,大切にしています.
2.2 管理人の狙い:多くの中級層への徹底的な支援
当サイトでは,2カテゴリでそれぞれ以下の点に注力します:
逆に,PyTorchやHuggingFaceの使い方などの実装面については,テキスト書籍も多く発売されており,私以外にも書ける人が多いで,詳しくはこのサイトでは書きません.ただ,「探索力向上重視」の幸男あるので,ソフトウェア でかいつまんでは,まとめて,サイト外部の資料に辿りやすくはしておきます).
私は,既にSSIIで学会の企画職も経験しており,ベンチャー創業期の経験もあります.また,中間管理職や役員経験も,年齢の割には多く,トップレベルの研究者(学生)の育成にも成功してきました.つまりは,ビジネス経験・研究開発経験の両方ともに,中堅〜準ベテランのキャリアである私だからこそ可能な「研究・ビジネス両面におけるハイブリッドな価値」の提供に集中したいです.
従って,俯瞰度も抽象度も高めの「アカデミックな話」と「ビジネスを意識した技術の話」や,「応用力の強化につながる話」などの提供にも,ゆくゆくは集中したいです.とはいえサイトに人が集まらないと話にならないので,まずは技術テキストである「用語集」の充実からはじめて,アクセス数の確保から始めます.
また,このサイトでは,コンピュータビジョンの体系化にも注力しています.体系的な知識やノウハウの習得に結びつくように用語集はWiki化して階層構造化+Wikiリンクで関連付けしており,それと連携が強くなるようにコラムの各カテゴリも展開することを意識しています.
2.2.1 著者の昔から一貫したターゲットでもある「中間層の充実」
昔から一貫している,私のコンピュータビジョン業界への達成目標は『日本の中間層の充実(プロ,アマ限らず)』である.「中間層を分厚くして,主人公を増やすこと」が,私の一貫した狙いです.
もちろん,私もまだまだ学び,経験しないとならないことが多いので,皆さまと一緒に更に成長できれば幸いです.ただキャリアが積まれてきた私から,初級者を脱して中級になりたての方々には,提供できる価値は多いと思うので,先人から学んだことを,みなさまに少しずつ還元できればと思います.
3.サイトの特徴と利点
管理人なりに,このサイトの特徴と利点(ウリ)をまとめるならば,以下のような点があると思います:
- 毎日使うだけで「探求力」が上達する設計
- 歴史・経緯の重視
- 実用力・ビジネス応用力も重視
- 管理人独自の分析・Tips
以下の子ページに,これらの利点と特徴について詳しく述べてあるので,より詳しくは,そちらを参考にしてください:
4. 「日本語サイト」で提供する理由
管理人は「画像認識・コンピュータビジョン全般」(CV)と「機械学習・深層学習(の特に実応用)」(ML)を,主な研究興味とし,なおかつビジネス専門分野としています.よって,素直にそれらのCVとMLを主テーマとするサイト構成にしました.
※「CVML」という組み合わせについては,ブログの「機械学習とかコンピュータビジョンとか」さんのタイトルにならって,この組み合わせを選んでいます
4.1 「学ぶべき標準的技術が多すぎる」の現状を打破したい
以前から,ビジョン系および深層学習・機械学習周辺の研究コミュニティでは,身につけておきたい標準的技術が膨大になってきており,効率良くそれらを身に付けないとスタートラインにも立てず,非常に辛いという問題を抱えていると感じています.
それら基礎教養の全てを知る必要は,必ずしもありません.しかし,ビジョン系の学会では細分化されて学会が開催はされず,全ての内容が1つのコンピュータビジョン会議に集結しがちです(マルチメディアや,信号処理など,特化された方向性では,個別の学会や論文誌はありますが).ということは,各項目について知っておいた方が,見聞は広まりやすく,アイデアも出てきやすいです.自分が得意なところ以外についてもアンテナが張れるようになれば,「あの人の技術や研究能力を頼りたい」と思うことも出てきて,その人に共同研究や共同開発をお願いしに行きやすくもなります.
※ もちろんそんな状況でも,広く知ることはやめて,「深く狭く攻める」のも戦略の1つです.
4.1.1 境界線のなさや,分野間融合の進展
深層学習ブーム以降,その「浅くても良いので知っておく方がよい基礎知識量」の雪だるま的な膨大化が,更に加速しています.深層学習は,その「モジュール結合の容易性」により,マルチモーダルやマルチタスク学習の容易さも増しています.それは,近隣分野との融合研究の増加にもつながりました.それにより,各分野間の境界領域では問題設定が混ざったり,過去の2分野以上の問題を合わせて解くことも多いです(Vision-Language や text2speech など).更に,どの問題に対しても通用するTransformerの登場で,以前より更にパターン認識系の各分野間の垣根がなくなりつつあります.
そうした中で,コンピュータビジョンと深層学習時代の標準的内容をこのサイトで日本語でWiki的構造として提供し,なおかつ重要な標準技術項目のみについて深く学べて検索もできるガイドマップを提供できれば,今後,長期的に20年~30年皆様に役に立つサイトを構築していけるはずだと考えました(2019年のサイト開設時点).これが,本サイトをCV,MLをターゲットにして,立ち上げた理由です.
4.2『日本語で』なだけでなく『良質な日本語記事』を届けたい.
かつて「コンピュータビジョンのセカイ」を,マイナビに連載提案をした頃から,私の一貫しているコンピュータビジョン情報発信の動機があります.それは「英語圏のWebでは大量にコンピュータサイエンスの情報があるが,日本語にはそういった情報源が少ない」という動機です.
このサイトの前身の「DERiVEコンピュータビジョンブログ(※ 既に削除済み)」も,同じ動機でした.ただし,博士号取得前である当時の私は,まだ技術的にもキャリア的にも未熟であったので,今ほど高レベルの内容を提供できませんでした.
コンピュータサイエンスにおいて,すっかり米国の次の2番手になった中国圏でも,現在では知乎(zhihu)などのサイトを中心に,洗練された情報が中国語で大量に出回っています.英語圏にもRedditに,大量のディープラーニング系の充実した議論が行われているスレッドがあります.しかし,日本語圏には,そうしたハイレベルな情報発信基地が,ネット上には存在しないのが現状です(ここの研究者がスライドは出していますが).そうした中,「日本語での情報提供」は私だけでなく,皆様にもぜひ頑張っていただきたいです.主張するのであれば,まず自らも行動で示したいというのが,このサイトを開設した理由の1つでもあります (2019年 開設).
知能的・機械的なタスクを人間以外に任せることが加速的に進んでいる現在,(それでも)働きたい人にとって大事なのは,「入力(分析力・破棄力)」と「出力(創造力・設計力)」の質であります.良いものを取り入れて,そこから良いものを出せることができるのが,次世代のプロフェッショナルです.創造性がない「機械的作業」は,徐々にロボットに任せて,人間はロボットができない抽象度の高い仕事や,器用な手先の仕事を担当する時代になってきています.
そんな時代の中で,情報の大海に溺れずに,自分自身に特有の探求先に強くフォーカスできるように,ぜひ,このガイドマップとしてこのサイトを長く有効活用していただきたいと思います.
当然ながら,(短い時間でも良いので),自分自身でWebで発信して,出力も積極的に行っていくことが大切です.このサイトは,授業的な「私→みなさん」単一方向的ではなく,Wikiやコラム群など,探索的で能動的に自分の興味に従って自分で探索して頂く,「探究活動の拠点基地」として,皆様にお役に立てることを意識して設計したつもりです.
最後に,繰り返しになるが改めて強調しておきます.このサイトは,CVとMLが好きな人向けの面白くて楽しい,自分も旅に出たくなるような地図であることを意識しています.著者自身も,観光地や,家の近くにある京都に遊びに出まわるときに,そうしたガイドマップを片手に歩くのが好きで,その発想がからインスパイアされたのがガイドブック的なこのサイトのサイト構造です.このサイトも,旅行ガイドのように「探索心を掻き立てる観光ガイドマップ」として,十年単位で時間をかけて,発展させていきたいと思います.
アフィリエイトプログラムの使用
当サイト「CVMLエキスパートガイド」は、amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである、 Amazonアソシエイト・プログラムの参加者です。