1. はじめに
当サイト「CVML エキスパートガイド」は,コンピュータビジョンやディープラーニングを専門とする中級者以上を対象に,「【📚用語Wiki ×コラム】とおすすめ書籍」」を中心として,サイトを使用するだけみなさんの探究力向上(自律力の向上や,)を支援する,拠点型wikiサイトです.
CVMLエキスパートガイドは,コンピュータビジョン(CV)と機械学習(ML) をテーマとし,ガイドマップ型構造により探求力向上のサポートを主目的にしており,とはいえ,このサイトは.CV周辺の他分野(例:自然言語処理,データ分析・機械学習系,グラフィックス等) が専門の方でも,記事の内容さえ読み解けるレベルであれば,活用可能な記事が多いずです.(特に,おすすめ書籍は,周辺分野が専門の方でも役立つ内容のはず).
このサイトの管理人,および全ての記事執筆は,コンピュータビジョン (特に動画処理と人物認識)を主専門としてきた「 Masaki Hayashi (博士・工学)」が(1人で)おこなっています (研究者個人ページ).このサイトを立ち上げる前には,CV初心者層向けTechブログの「DERiVE コンピュータビジョンブログ (サイト削除済み)」を運営していましたので,少し上の世代の人はそちらを覚えている方が多いと思います.
[2025/6月 追記]:最近noteに書いたサイト紹介記事「コンピュータビジョン中級者以上向けのサイト 『CVMLエキスパートガイド』の紹介: 「探究力重視への移行」の狙いと,探究力を伸ばす主内容「用語wiki」について.」も,参考になるはずです.
初めてサイトにお越しになった方は,以下の説明書ページから読むと,すぐに使用を開始できます:
1.1 CVMLガイドのターゲット層「中級層」と ,上級者層
当サイトは,ガイドマップ型構造により,中級者以上の探求力向上のサポートを主目的にしています.普段の仕事でも,私は「コンピュータビジョン(Computer Vision)を使用されている中級者層以上の方々すべて (初心者を脱して以降〜)のレベルアップ支援・育成」を主ターゲットとしています.
CV中級者以上のなかでも,育成側の立場である中級〜上級者層( 大学教員・研究員の方や,研究開発者の中でも管理職以上)にも,授業・講義のサポート (学生の参考資料として使う)や,開発・研究のアイデア出しのお供としても,お役立ちできるサイトです.
※ 特に,授業のレファレンスで,用語wikiを使用している大学教員の方々には,「問い合わせ」等からのフィードバックや,応援の声をお待ちしています.
1.2 中心コンテンツ「用語wiki」の設計はWikipediaライクなツリー構造
本サイトは,(Wikipedia-likeな)技術(用語)間の関連性・ツリー構造を意識しています.CVMLエキスパートガイドの中心コンテンツは📚用語wiki です.その📚用語wiki の「wiki構造」で,検索・学習しやすく提供しており探究しやすいという点が,サイトの最大の特徴・利点です (2.2節).旅行ガイド本,趣味・スポーツ別の攻略本のように,学習・復習や,研究のアイデア出しの能力・効率向上を「用語wiki のwiki構造が」(あまり意識しないでも)助けるはずです.
そのような「探究力が向上する内容・wiki」を提供することにより,日本の中間層全体のパワーアップを実現することが,本サイトの狙いです(2節).もちろん,初心者を中級者に育てている大学教員勢の方々や,企業の育成担当・管理職などの上級者勢にも貢献したいです.特に 📚用語wiki は,大学の授業や,社内勉強会の参考資料として使用できるので,(1)初〜中級者にも,彼ら(1)に講義や育成をする側の(2)教員・管理職側・中堅エンジニアの方々にも このサイトが役立つはずです.
1.3 サイトの著作権
2節以降で詳しい話に入る前に,「このサイトの著作権」について先に書いておきます:
(これを踏まえた上で,2節から,サイト内容・構成や狙いについて述べていきます).
本サイトの全ての内容,記事中のテキストおよび(自作した)画像等の著作権は,全て著者である私,Masaki Hayashi に帰属するものとします.テキストや画像の無断転載は禁止です(引用の範囲を超えない,少量の文書引用であれば当然問題ありません).[2023年3月27追記] また,サイト中の文字や図表を,機械学習モデルへの学習データとして利用することを禁止します.スクレイピングして,内容を加工や改変を行なったものを,学習データ化することも禁止します
2. サイトの設計・構造とその利点について
2.1 サイト内・外ともに「探求」をしやすい「探究学習」設計
当サイトではユーザーによる自立的な学習・探求を重視しており,その目的のためにまず第一に「探索・検索しやすい設計」にこだわったサイト構造に設計しました .以下のように,サイト内でもサイト外でも探究(自分の意思に基づいたリサーチ)がスムーズになるようにしています:
当サイトは,以下のサイト内・サイト外の両リソースを通じて標準的知識・スキルを磨きやすい設計にしています:
またサイトの設計には「回遊性・探索性」を重視しています.旅行ガイドや,趣味むけ書籍・サイトのように,自分の行きたい場所・方向に探索・周遊が便利になる設計にしており,サイト全体の地図的な使い心地の良さやWiki感・階層感を重視しています.
《サイト内での探求》 | 《サイト外への探求》 |
「wiki構造での体系的知識化」につてとめています(特に用語集). | 「論文・指定参考書・良い記事」へのリンク・参照設置につとめています. |
2.2 サイトの構造:探究的に活動する拠点となるサイト
(本サイトの運営を通しての)私の狙いは,CV業界や周辺業界の皆様を長期的にご支援し,中間層のパワーアップをもたらすことです(2.2.1節).その目的を達成するために,[用語集 📚 × コラム💡]の,主要2面構造のガイドマップ型サイトとして設計・提供しています(2.3節).特に用語wiki やおすすめ書籍を通じて「標準的知識集約サイト」+「外部の論文・情報への拠点サイト」の役割を提供します.
また(あまり記事の数は多くないですが) コラムを通して,普段の行動計画力や,アイデア出し力(サイト内外での検索や回遊に,論文キーワード),疑問力(Q&A)も自然と向上していくようにしています (※ 探求力向上や自律性育成に,リサーチ力の強化を重視).
日々の拠点サイト,ベースキャンプ⛺毎日通うカフェ☕️のように,このサイトを活用して頂くと,(特に大学や、画像認識新人の方々は)、日々の生活が成長を感じる,より充実したものに更新されるはずです.
2.3 サイトの主内容:「用語集wiki (× コラム)」の2面構造
![CVMLエキスパートガイドの全体構造[2面構造] | CVMLエキスパートガイド CVMLエキスパートガイドの全体構造[2面構造]](https://cvml-expertguide.net/wp-content/uploads/2023/03/8d35d4463f1215d41c623c49288c7314-1024x576.png)
当サイトでは,[用語wiki 📚 (× コラム💡)] の記事群を通して,「探究活動」の充実と向上を,日常的にサポートします.
2.3.1. 用語Wiki 📚
用語Wikiでは[知識 📚] :標準的知識・技術(What)(どちらかというとIQ面)を伸ばすような,体系化・俯瞰化が進み,探究や,調査・研究がしたくなる記事を提供します:
2.3.2 コラム💡
コラム💡では,[知恵💡]:調査・技能 (How, Why) 感覚・センス・アイデア力 (どちらかというとEQ面)を伸ばすような,自分で再考,議論,問いを立てる・開発や創造したくなる記事を提供します:
これら用語wiki 📚 (× コラム💡)のコンテンツや,「おすすめ書籍」「ソフトウェア」のコンテンツを通して,,日常的に使用・探索・復習しながら,研究開発やアイデアだしもしていただくことで,読者の皆様の実力が,自然と向上していく事を狙っている設計です.ようは使うだけで探究学習になるようにしました
この2面構造サイトを通して,ユーザーの方が,[知識(どちらかというとIQ) × (どちらかというとEQ)] の2面両どりを狙えるようにしているつもりです.
2.3 おすすめ書籍
おすすめ書籍」カテゴリーの記事では,コンピュータビジョン,ディープラーニングや,
3. サイトの狙いとターゲット層
管理人の(当サイトでの)ゴールとしては,中級者層以上への強力な支援を行うことで,読者のみなさまが「(1)研究・開発力(理論)と,(2)ビジネスや社会での実践(応用)の両面で向上する」結果を狙い,結果的に「コンピュータビジョンやディープラーニング界隈の業界全体が強化される」ことを目指しています.
現代のCV・DLは対象範囲がやたらと広く,自分の仕事のターゲットを絞りづらいはずです.その中では,個々の技術をバラバラに理解しても力が発揮しきれないゆえ,独自に(= 他と差別化しながら)体系的な知識・知恵をターゲットを絞って構築していくことが重要です.
あと,(当サイトも「体系的に技術を学びやすく」はしていますが),独自での「得意・興味技術の体系化」にも日々努めて下さい.私や,私のような専門家の書く内容を,安易に鵜呑みしないことも大切です.
3.1 エキスパート「ガイド」とは?
サイト名に「エキスパート(向け)ガイド」と入れてあるように,このサイトでは,ガイドマップ(地図) のような構造・構成による「ガイド機能」の役割を提供することを意識しています.たとえば,観光地に持っていく「るるぶ」や「地球の歩き方」のような役割や,現地ガイドやバスガイドのような「楽しませながらガイドする」役割を目指しています.つまりは, 読者が旅の主役となって,楽しく目的もある旅を続けるための「ガイド本・観光ガイド」を提供したいのが管理人の動機です.もっと言うと,毎日のみなさまの研究開発活動が「面白く・より探究的になる」ことも,意識しています (サイトをブラブラと探索するだけでも楽しくなるように).
また,探究力・自律力の向上や,スキル向上を狙っているので,趣味やスポーツやゲーム向けの「攻略本」「How to 本」や「戦術指南本」のような役割も当サイトの各記事では意識しています.実応用での勘所や,各タスクごとの記事(=応用の仕方) の提供も各記事で重視することで,どう使うか,どう分析するかなどの「各知識の関係をもとに,どう実際に使うか・考えるか」の,知恵・ノウハウの向上も,大切にしています.一方で,自律・探究重視なサイトなので,応用・アプリの具体的話や「これやれ,あれやれ」「これやるな」「あれやるな」を余り言わないようにしており,その意味では,内容の抽象度は高めでありますが.(※ 皆さんは大人なんだから,「これをやりたい」は自分で見つけてください.)
3.3 管理人の狙い:多くの中級層(以上)の方への支援
当サイトでは,2カテゴリでそれぞれ以下の点に注力します:
また,このサイトでは,コンピュータビジョンの体系化にも注力しています.体系的な知識やノウハウの習得に結びつくように用語集はWiki化して階層構造化+Wikiリンクで関連付けしており,それと連携が強くなるようにコラムの各カテゴリも展開することを意識しています.
2.2.1 著者の昔から一貫したターゲットでもある「中間層の充実」
昔から一貫している,私のコンピュータビジョン業界への達成目標は『日本の中間層の充実(プロ,アマ限らず)』である.「中間層を分厚くして,主人公を増やすこと」が,私の一貫した狙いです.
4. 「日本語サイト」で提供する理由
管理人は「画像認識・コンピュータビジョン全般」(CV)と「機械学習・深層学習(の特に実応用)」(ML)を,主な研究興味とし,なおかつビジネス専門分野としています.よって,素直にそれらのCVとMLを主テーマとするサイト構成にしました.
※「CVML」という組み合わせについては,ブログの「機械学習とかコンピュータビジョンとか」さんのタイトルにならって,この組み合わせを選んでいます
4.1 「学ぶべき標準的技術が多すぎる」の現状を打破したい
以前から,ビジョン系および深層学習・機械学習周辺の研究コミュニティでは,身につけておきたい標準的技術が膨大になってきており,効率良くそれらを身に付けないとスタートラインにも立てず,非常に辛いという問題を抱えていると感じています.
それら基礎教養の全てを知る必要は,ありません.しかし,ビジョン系の学会では細分化されて学会が開催はされず,全ての内容が1つのコンピュータビジョン会議に集結しがちです (マルチメディアや,信号処理など,特化された方向性では,個別の学会や論文誌はありますが).
各項目について知っておいた方が,見聞は広まりやすく,アイデアも出てきやすいです.自分が得意なところ以外にも(詳しくは知らずとも)アンテナが張れるようになれば,「あの人の技術や研究能力を頼りたい」と思うことも出てきて,その人に共同研究や共同開発をお願いしに行きやすくもなります.
※ もちろんそんな状況でも,広く知ることは控えて「深く狭く攻め続ける」のも戦略の1つです.例えば,飲食店でも「○○一筋〜」という攻め方・こだわりで成功している方は結構居ますから.
4.1.1 境界線のなさや,分野間融合の進展
深層学習ブーム以降,その「浅くても良いので知っておく方がよい基礎知識量」の雪だるま的な膨大化が,更に加速しています.深層学習は,その「モジュール結合の容易性」により,マルチモーダルやマルチタスク学習の容易さも増しています.それは,近隣分野との融合研究の増加にもつながりました.それにより,各分野間の境界領域では問題設定が混ざったり,過去の2分野以上の問題を合わせて解くことも多いです(Vision-Language や text2speech など).更に,どの問題に対しても通用するTransformerの登場で,以前より更にパターン認識系の各分野間の垣根がなくなりつつあります.
そうした中で,コンピュータビジョンと深層学習時代の標準的内容をこのサイトで日本語でWiki的構造として提供し,なおかつ重要な標準技術項目のみについて深く学べて検索もできるガイドマップを提供できれば,今後,長期的に20年~30年皆様に役に立つサイトを構築していけるはずだと考えました(2019年のサイト開設時点).これが,本サイトをCV,MLをターゲットにして,立ち上げた理由です.
4.2『日本語で』なだけでなく『良質な日本語記事』を届けたい.
かつて「コンピュータビジョンのセカイ」を,マイナビに連載提案をした頃から,私の一貫しているコンピュータビジョン情報発信の動機があります.それは「英語圏のWebでは大量にコンピュータサイエンスの情報があるが,日本語にはそういった情報源が少ない」という動機です.
このサイトの前身「DERiVEコンピュータビジョンブログ(※ 既に削除済み)」も,同じ動機でした.ただし,博士号取得前である当時の私は,まだ技術的にもキャリア的にも未熟であったので,今ほど高レベルの内容を提供できず「初心者向け内容・技術的にも深掘りできておらず」でした.
また,このサイトは(ブログや講義と異なり),授業的な「私→みなさん」単一方向的ではなく,Wikiやコラム群など,探索的で能動的に自分の興味に従って自分で探索して頂く,「探究活動の拠点基地」として,皆様にお役に立てることを意識して設計したつもりです.開発グループや,研究室に,授業などで使うと,能動学習的や探究学習的に,「調べて.考えて,議論して」行な助けになり,それがグループ・組織での実力向上を助けやすい設計と思います.また,みなさんのけんきゅうや開発でのアイデ出しにも,かなり効いてくると思います
(※ 「実際に当サイトが効きました」と言う方は,ブログなどを書いてぜひ報告してくだしさい!問い合わせから,励ましのお便りなども歓迎です).
最後に,繰り返しになるが改めて強調しておきます.このサイトは,CVとMLが好きな人向けの面白くて楽しい,自分も旅に出たくなるような地図であることを,執筆で意識しています.著者自身も,観光地や,家の近くにある京都に遊びに出まわるときに,そうしたガイドマップを片手に歩くのが好きで,その発想がからインスパイアされたのがガイドブック的なこのサイトのサイト構造です.このサイトも,旅行ガイドのように「探索心を掻き立てる観光ガイドマップ」として,十年単位で時間をかけて,発展させていきたいと思います.
アフィリエイトプログラムの使用
当サイト「CVMLエキスパートガイド」は、amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである「Amazonアソシエイト・プログラム」の参加者です。
Amazon商品画像/情報のAPI経由での取得・使用に関して: 「本サイト上」で表示されるコンテンツの一部は、アマゾンジャパン合同会社またはその関連会社により提供されたものです。これらのコンテンツは「現状有姿」で提供されており、随時変更または削除される場合があります。