用語集📚

目次

1. はじめに

用語集カテゴリーの各記事は,各ページを教科書のような解説記事で構成するWiki型の用語集です.コンピュータビジョン・ディープラーニングを主たるフォーカスとしています.また,深く関連している「NLPの記事」も少し多めです.

3節で詳しく述べるように,「Wikiポータル 兼 教科書」の2つの機能のハイブリッドを用語集では特に目指しています.

カテゴリごとの「用語一覧ページ」へのリンクを,以下の表に列挙します:

✳️ディープラーニングの用語記事✳️データセットの記事の一覧
📷コンピュータビジョンの用語記事📹自然言語処理の用語記事
機械学習の用語記事研究用語の用語記事

各記事では,コンピュータビジョン界隈の標準的技術について「図つきでわかりやすい,教科書のような解説記事」を各「用語記事」として提供します.また,用語記事同士の関係(ハイパーリンク)・全体の階層構造 (URL)を,Wiki型の用語集として提供します.

1.1 用語集の記事で意識していること

用語集では,以下のようなことを意識して記事を書いています:

  • 少し詳しいめの内容まで提供を行うが,それでいて実践に使えて大事な標準的技術のみを厳選した内容 (教科書や授業では,各項目が短く終わりがちだが,このサイトでは各記事でも少し深掘りを行う).
  • Wikiポータルとして,外の関連情報(論文,Web記事,paper with codeなど)にもすぐアクセスできるように,Reference情報を充実させるようにしている.
  • 各モデル技術の抽象的な羅列・紹介だけでは,応用で使えるようにならないので,実用で必要なTipsや,各タスクの話もしっかり書く(ただし,各ビジネス領域の話まではあまり行わない).
  • よって,ディープラーニングの用語記事は,1.モデルと2. タスクに分けて,両方とも書くことを意識している.
  • 初級者・中級者むけの教科書やテキストよりも,少し先の話まで含めた内容 まで用語集うに含めるようにしている(2.1.1節で具体例).
  • 最先端技術までは追わない.まだ実用性あるかの判断がつかないのが理由.

1.1.1 テキスト化されていない標準的技術も,先んじて盛り込む

「日本語圏のテキスト・講義では,まだあまり解説されていない技術」でも,海外では既に標準的技術として定着済みとなっており,日本においても現場では,盛んに研究開発・ビジネス実応用されている技術も多いです.

しかし,日本のCV業界では,テキスト等や学会チュートリアルなどで,それらをうまくカバーしきれていないと考えます.英語圏のサーベイ・チュートリアルはあっても,第一人者が日本人にいない技術の場合だと,日本では遅れてフォローされてチュートリアル・サーベイなどが組まれる状況です.

そこで当サイトでも以下のような「まだ教科書化されていない技術」も,先行的に取り上げる事も意識しています:

ただし,あまりに最先端の話まで書くのは私も無理なのと,大学の授業よりちょっと先にさえいけば,実用レベルでは十分みなさまのお役に立てるのもあり,「日本語の教科書・書籍より少し先取り」というスピード感を目指しています.

3. 用語集の方針 : 「Wikiポータル 兼 教科書」

用語集では,設計思想として「サイト全体は,Wiki・ポータルサイト的に階層・カテゴリ的に記事を配置」×「個別の記事は,教科書・サーベイ的に構成」という考え方を採用しました.つまり,用語集の構造では,以下2つの両立をGlobalLocalで狙っています:

  1. [全体構造] (用語集全体):
    • 用語間の関係を表わすWiki (記事の階層ツリー + 記事間リンク)を構成.
  2. [局所構造] (各用語記事) :
    • 構造文書化されたテキスト解説として各記事を提供.

すなわち「ページ間で構造を成すWikiサイト[全体構造] × 教科書以上に詳しい解説 [局所構造] 」 のハイブリッド構造を意図した用語集を,コツコツと構築していっています.その構造を活かすためには,親記事も別タブに開くことで,親記事とセットで(補助にしながら)各記事を読む習慣をつけることをオススメします.

この「用語記事間も,用語記事内も,共に階層構造をなしている」設計思想を知らない場合,「単なるWikipediaスタイルの用語集」のように見えてしまうことに注意です.各用語記事は,教科書・テキストと同様の,わかりやすく簡潔な記事であり,なおかつ市販の教科書やテキスト本よりも,個別の用語に対して読みごたえ・実用性の解説度も高い記事を目指しています.よって,Wikipediaなどの百科事典サイトとは,執筆方針が異なります.各用語記事はWikipediaほどは詳しく網羅的にはせず,詳しいながらも簡潔で,プロとして質の高い出力を行うのに必要な標準的技術の習熟・鍛練にのみフォーカスしています.

教科書と異なり,Web講座のように,Webですぐ閲覧できるのもポイントです.特に,Webコースでもない,用語ページ間がWikiリンクしているという,最近のノートアプリのような機能が,利用者の皆様に閲覧・検索効率の高さと,繰り返し閲覧による理解度向上も助けるはずです.さらには,(中〜上級の)ポスドク以上のレベルの研究者の方や,教員や企業研究開発リーダーレベルの方でも,アイデア出しへの貢献をもたらすと考えています.

※ サイト内で何度も強調してはいますが,むやみに最先端を追う以前に,プロとして研ぎ澄ませるべき標準的技術をハイレベルに使いこなせることが重要です.その標準的技術について,階層構造を用いて徹底的に習熟・探索・アイデアだしやすいサイト構造ですので,中級者のみならず上級者にも長期的な利益をもらたらすと考えています

それぞれの用語記事は,簡潔かつ重要な標準知識のみを厳選して述べる「教科書やWeb解説記事のような記事構成」を採用しています.したがって自作の図解を豊富に作図し,Deep Learningの理解で大事な,図を通じての,視覚的にわかりやすい解説も,こころがけています

皆さまには,専門性を高めて,博士(=マニア)になっていただきたいので,市販の教科書よりは,各記事で,詳しく深い話を展開します.ただし,内容自体はマニアックでも,説明文・説明図はあくまでわかりやすさを重視し,各記事も不要な内容は載せないようにしています.また,紹介内容も,実装とはなるべく分離して話すようにし,紹介内容の抽象度の高さとそれに伴う汎用性の高さを,うまく保つようにしていますいます.

まとめると,「(1) 初〜中級者向けの導入・チュートリアルで使用できる用語集」でありながら,同時に「(2)中級~上級の皆様むけにもマニアが楽しむガイドブックとしての役割」も保てるような「記事内容および記事全体での階層的探索性」の構築を狙っています.旅行ガイドや・ゲーム攻略本のように,このサイトを探求的に楽しく活用して欲しいので,このような設計を考えついた理由です.皆様の知識構築による「学び」と,その学びから拡がる探究・思索を下支えする地域探訪ガイドブック的な役割を担えると,管理人としてはうれしいです.

逆に言うと,このサイトは,初心者は対象外です.AIエンジニアとして製品実用の経験がある程度あったり,論文がある程度書ける研究者見習いレベルの中級者になってから以降,あらためて「総合ガイドブック的な価値の高さ」としての,「本サイトの良さ」が分かるようになり,皆様に更なる効果が出るサイトだとわかると思います.まずは中級者層の入口である,脱初心者をめざしてください.

3.1 用語集の「Wiki構造化かつ教科書化」(管理人の目標でもある)

「教科書」という形式は,書籍というスペースの制限で,各内容を短く列挙するだけに終わりがちです.その制限を打破し,体系的に把握しやすく,効率良くページ間を遷移しやすいWiki型テキストを構築することが,管理人としての用語集の目標でもあります.

教科書ならさておき,昨今のディープラーニングテキストは,前後のつながりや,独立した技術紹介の羅列で終わってしまい,それらの関係性や,歴史的経緯が十分に書かれておらず,各技術が点と線で繋がっていないテキストも多いです.

※ ただし,パターン認識・業界では,突発的に出てくる技術の量も双頭多いので,歴史的解釈はなかなか難しく,急いでテキスト化しようとすると整理が間に合わず羅列的に終わってしまうのも理解できます.

そこで,体系的に学びやすいことを全体の狙いとするため,(3節冒頭にも述べたように)執筆時には「記事間(global)・記事間(local)の双方での構造化」をこころがけています:

[1] 記事間(global)の構造化: 階層的カテゴリ分類 + 記事間の用語リンク.

Wikiサイト化で,用語間の関係を(WordNet的な)階層的なツリー構造化を狙っています.要するに「Wikipediaのコンピュータビジョン版」を狙っています.Wikiにしておくと,関係性もリンクやURL構造で示せるし,長文で細かな話も展開しやすいです.

各記事のURLに出ている階層構造は,よく意識しながら使用してほしいです(特にディープラーニングの用語記事のツリー関係).俯瞰思考は大事です.私自身も,各サーベイ論文の樹型図やテーブルによるまとめに,非常にお世話になっております.

また,書籍では不可能な用語記事間のハイパーリンクが,理解向上や,研究時のアイデア出し・思索を,更に助けてくれるはずです.

以上のように,用語記事間の全体的な関係性は勝手に埋込まれています(裏にツリーとグラフ構造があるわけです) .したがって,日常的に使うだけで,自然とその構造が身に付くはずです(教科書や書籍だと,全体構造を意識できていない人も多いはず).

[2] 記事内(local)の構造化:歴史順の説明や,関連技術のグループ分類.

それぞれの記事内(local)の構造化にも,力を入れています.

CV・DL分野のテキストは,内容過多になりがちなせいもあって,各用語の説明は短く要点だけ終わってしまうことも多々あります(ひどければ言葉の列挙だけでおわる).各層やアルゴリズムに,タスクの詳細もわからないままです.そういった自体を避けるために,百科事典(Wiki)とテキストとガイドブックのいいところどり(良いバランス)を狙っているつもりです.

また,章立てして,節番号と見出しから内容がわかりよい(論文の構成のような)記事にしています.「1節が導入,最後の章で結論とまとめ(や追加の議論)」という構成に,各記事のフォーマットも統一し,読みやすいようにしています.

短時間の理解を助けるためわかりやすい図の作成にも力を入れています.各記事の内容が,(用語のサマリーでもある) 図1を通して,記憶に定着しやすいようにしています.各節も,簡単な説明に終わらず,それでいて簡潔に,無駄な点は省いて重要点だけを取り上げるようにしています.

また,各用語記事では,歴史的な経緯の説明にも力を入れています(例:人物姿勢推定やインスタンスセグメンテーションなど).管理人としては,その問題設定が初めて提案されたころの,初期の手法(=解き方)が,特に(本質的)大事だと考えています.後続研究は,手法の改善を続けているだけの場合が多いためです.物体検出などの「問題(タスク)」の記事では,少なくとも,ディープラーニング初期の解き方は,必ず触れるようにしています.

※ 記事数が溜まってきたら、複数の記事を時系列準でつなぐツアー的な用語記事・Q&A記事も増やしたい.

加えて,モジュール結合的であるディープラーニングでは,各層やブロックについて「なぜその問題の場合に採用するのか」を把握しているのが大事と考えます.これは,損失関数についても同じことが言えます.よって,それらの部品や学習・最適化系の記事でも,きちんとグループ分類をおこなうことで,各部品がどのように違い,どれを選べばよいかを,読者が考えられる記事の構成にしています.

3.2 用語集のおすすめ使用法:「探索的」に読む

この用語集は,全体の規模が大きいのもあり,全部を読みつくしていく用途には向いていません.管理人も,将来的にはWebコースなども用意して,この用語集を教科書代わりとしても活用したいのですが,現時点ではそういった「半年単位の授業・コース」とは連携していないので,網羅的に用語集の内容を、このサイトで全て身につけていくのは,かなりしんどいはずです.

よって,ご自身のフォーカスに沿って,自身に現時点で必要な内容のみコツコツと探索的・検索的ににたどっていく使用法がオススメです.特に初心者に近い方ほど,このサイトの用語集は,一気読みは不可能なほどの内容の多さと深さなので,知りたいところ、読みたいところだけ読めば十分です.しいては,読みたい記事のみ繰り返し読み返すのが,現実的かつ有効な活用法です.

1.2で述べたように,記事間および記事内も構造化しているゆえ,用語記事の各カテゴリーのトップページ(2節)は重要な拠点ページです.ディープラーニングの用語記事ページが,特に全体構造を表わしているので,頻繁にアクセスすると有効にサイトを活用できるとおもいます.

ちなみに,各記事での「数式の記法」の標準的なルールは,以下のページに別途まとめています(※ まとめてあるが,著者もたまにこの記法から脱線するときはある):

関連記事:このサイトにおける数式の記法

4.「用語集」の狙い.

サイト構造の説明を中心に3節まで紹介してきました.最後に,この4節では,「用語集を通した(中級者向けの)狙い」を,以下の3つにまとめておきます:

  • 狙い1: 重要な標準的用語のみを厳選
  • 狙い2: Wiki化による関連性・ツリー構造の把握による「俯瞰力を向上」
  • 狙い3:「自分の目的に沿った情報」のみへフォーカスしやすくする

3つの狙いについて,それぞれもう少し詳しく述べていきます.

4.1 狙い1:重要な標準的用語のみを厳選

代表的な,今後10年以上は役に立つ重要な標準的用語を,簡潔に解説した記事を提供します.読者の学習や復習だけでなく,今後の探求活動で役立にたつガイドマップサイトにしたいです.

読者の方々が,各用語の情報・応用方法を,「(1)このサイトから」もしくは「(2)脳から直接」必要な時に引き出しやすくすることも狙いたいです.

4.2 狙い2:Wiki化による関連性・ツリー構造の把握で「俯瞰力を向上」

Wikipediaのように各用語は詳しくは説明はしないが,用語ページ間はしっかりハイパーリンクさせることで,これまであまり(教科書やコースでの勉強では身に付けづらかった)用語間の関連づけや,ツリー階層的な関係へと焦点が当たりやすくします.随時,各記事を横串にさしてまとめる記事も,書いていくつもりですが,そもそも各記事にある「他用語ページへのWikiリンク」を通じて,読者の理解が更に深まってっていくことを期待しています.

サイト全体として,各用語を体系的に構造して捉えられるようにしていきたいです.(著者もこの構造のおかげで理解度が向上し,年を経るごとにサイトや講義の質もあがっていくはずです).

4.3 狙い3:「自分の目的に沿った情報」のみへフォーカスしやすくする

研究者の方々や,研究者を目指したり研究結果を応用する側のR&D系の方々は,論文や情報の時系列的な羅列は,それこそarxivの最新のpreprintをチェックするだけでなく,各種サイトやSNSなどでも最新の研究の解説の情報を得ていると思われます.

しかし,管理人はそれらの大量の情報の波に,ただ溺れているだけの方が多いことを危惧しています.目立つ有名研究や人気技術や,人気のアカウントが紹介する技術ばかり,不必要に後追い(フォロー)していませんか? あなた独自の能力や,レアさを伸ばしていくために、本当にその最先端の技術や,流行りの技術をやたらめったらフォローする事があたなの成長につながりますか?自分が後追いしているだけで状態でだと認識したまま,「みんながやっていること」,「烏合の衆」にまぎれてしまって,隣の会社や研究室と差が出せないまま,何年も埋もれてしまっていせんか?

情報は自分なりに解釈して整理し取捨選択することで,初めて(独自性の強い)良いアウトプットを産むことにつながると管理人は考えます.一流のプロを目指す途中段階では,多読や過剰な情報収集は悪手です.情報の厳選と,その精読が,短い時間でしっかり成長するのには重要です.他人との差異や,独自の特徴を強く出せるようになって始めて,モノマネバンドのレベルから脱し,一流プロレベルのアウトプットを出せるようになると思います.

当サイトの用語集を,情報整理と取捨選択(少数に厳選)する際に,うまく活用していただきたい限りです.

※ このサイトに頼りすぎず,ご自身でも必要な知識や考え方などを,独自にノート化していくことを,強く勧めておきます.

5. 用語集の各記事ページの構成

上記のような狙いを踏まえて、各用語を紹介する記事ページは以下のような構成にしています:

  • 用語の説明自体は「テキスト・教科書のような解説」
    • よくある教科書よりは,各ページの解説は,詳しく深い
    • しかし,内容は重要な内容のみを厳選.
    • より発展的な内容は用語記事の外で,「論文」や「書籍」「Webサイト」などを自分で探索してもらい,(探求的に)学んでもらう方針.

  • 教科書よりは,少し実用性を重視した内容.
    • 実際のパラメータ値や,初期設定の入力サイズ・パラメータ値なども示すようにつとめている.
    • それでも,実用でひっかかるとこや,応用するときに失敗しがちな点のノウハウも少しだけ書くようにしている
      • それがないと,抽象度高すぎて実装にも落とせないと,ただの道具の羅列で使い方がわからなさすぎて教科書としての役割が小さくなってしまうのが理由
    • 実装の話までするのは執筆コスト的にきついので,書籍などに任せて最小限に抑える,
  • 多くの人に通用する抽象度・汎用度の高い内容の執筆に私は集中したい.
    • また,価値が高いノウハウは,さすがに有料書籍・講義でしか出さない.
    • そうしたレベルまで手伝って欲しい方は,コンサル・コーチや顧問を依頼して頂きたい.

  • 用語記事ページが,それぞれ論文のような章構成になるよう構成:
    • 1節で概要と図1を提示し,最後の節ではかならず「まとめ」を行う
    • 普段からこの形式に慣れ親しんでもらうのが一番なのも理由.
    • より詳しくは「説明書🔰と活用法💪」の2.2.節「典型的な記事構成 (本文)」を参照.
  • 外部リンクの充実:
    • 関連する用語ページへは,(サイト内)ハイパーリンクを貼る.
    • Web記事や,おすすめ書籍も,記事最後の「References」の節にリストアップ.

「自作の図」と「リスト」も駆使することで,多すぎない文字量の記事にするように心がけています.基本的には「多くとも1万字以内」に各記事の字数とどめようとしており,1万字を超えると,その一部分を子記事に分割するようにしています.