用語集

1. はじめに

用語集」カテゴリーの各記事は,各ページを教科書のような解説記事で構成するWiki型の用語集である.コンピュータビジョン・ディープラーニングを主たるフォーカスとしているが,深く関連しているのでNLPの記事も少し多めである.

2. 各カテゴリの「用語記事リスト」へのリンク

「カテゴリの用語記事リスト」へのリンクを,以下の表に列挙する.(ホームの「1.用語集」にも、同じ表を用意してクイックアクセスできるようにしてある.)

ディープラーニングデータセット
コンピュータビジョン自然言語処理
機械学習研究用語

※ サイト内上部のメインメニューバー(青色)の「用語集」に,以下の各カテゴリ別一覧ページへのリンクボタンを設置している.また,サブツールバー(青色)にも,そのうち大事なページへのリンクを分解して配置している.したがって,普段はこのページを経ずに,ツールバー経由で,各一覧ページへ直接アクセスしていただくほうが効率的である.

2. 用語集カテゴリの方針

このサイト中全体でもそうであるが,特に用語集では,設計思想として「個別の記事は,教科書・サーベイ的に構成 × サイト全体はWiki的に階層・カテゴリ的に記事を配置する」という考え方を採用している.すなわち「Wikiサイトと教科書のハイブリッド」をねらった,用語記事集を構築している(その狙いや動機について詳しくは,「サイトと著者について」を参照).

ページ間の階層構造やWikiリンクを用意しているので,一見すると全体はWikipediaスタイルのように見える.しかし,各用語記事の内容は,WikipediaやWiki系サイトのように網羅的に書くことはせず,教科書・テキストと同様の,わかりやすく簡潔な記事でありながらも,逆に教科書よりも深くて読みごたえや実用性も高い記事を目指していて,Wikipediaとは執筆方針が大きく異なる.

それぞれの用語記事は,簡潔かつ重要な標準知識のみを厳選して述べることで,教科書やWeb解説記事のような記事構成を採用している(従って,自作の図を豊富に用意し,視覚的なわかりやすさも追求している).一方で,皆さんには専門性を高めてマニアになっていただきたいので,市販の教科書よりは,各記事で,詳しく深い話を展開する(ただし,説明はあくまでわかりやすさを重視).

要するに,「(1)初・中級者向けの導入・チュートリアルで使用できるもの」でありながら,同時に「(2)中級~上級の皆様むけにもマニアが楽しむガイドブックとしての役割」も保てるような「記事内容および記事全体での階層的探索性」の構築を狙っている(つまり,楽しく活用して欲しいわけである).

皆様の知識構築による「学び」と,その学びから拡がる探究・思索を下支えする地域探訪ガイドブック的な役割が,このサイト全体および「用語集」のゴールと定めている.よって,各記事は,一読すると平易な文章では読みやすいが,その内容としてはプロにも興味をそそるような,専門家向けのしっかりとした内容にしている

逆に言うと,このサイトとは初心者は対象外である.論文がある程度書けるレベルの中級者になってから,初めて,各記事やこのサイト全体の「総合ガイドブック的な価値の高さ(探究するためのガイドブックとしての良さ)」がわかるようになる.

2.1 用語集の「Wiki構造化かつ教科書化」(管理人の大目標)

「教科書」という形式は,スペースの制限で,各内容を短く列挙するだけに終わりがちである.これが,Wiki形式を採用した理由でもある.体系的に学びやすいWiki型教科書の構築が,管理人としての用語集構築の目標である.

教科書ならさておき,昨今のディープラーニングテキストは,前後のつながりや,独立した技術紹介の羅列で終わってしまい,それらの関係性や,歴史的経緯が十分に書かれておらず,各技術が点と線で繋がっていないテキストも多い(※ ただし,パターン認識業界では,突発的に出てくる技術も多いので,歴史的解釈はなかなか難しいので羅列で終わってしまうのもわかる).

体系的に学びやすいことを全体の狙いとするため,執筆時には以下のように「記事間(global)記事間(local)の双方での構造化」をこころがけている:

[1] 記事間(global)の構造化:階層的なカテゴリ分類 + 記事間用語リンク.

Wikiサイト化で,用語間の関係を(WordNet的な)階層的なツリー構造化を狙っている.それは要するに「Wikipediaのコンピュータビジョン版」を狙っている.Wikiにしておくと,関係性もリンクやURL構造で示せるし,長文で細かな話も展開しやすい.各記事のURLに出ている階層構造は,よく意識しながら使用してほしい(その中でも,当歳とのメインであるディープラーニングの用語記事のツリー関係).

また,書籍では不可能な「用語単語を通じた用語記事間のハイパーリンク」が,さらに皆さんの理解向上や,研究時の思索を助けるはずである.(※ これがやりたいからこそ,web上に構築しているとも言える).

以上のように,用語集の全体をWiki構造化しているので,用語記事間の関係性は勝手に埋込まれていっている.よって,このサイトを日常的に使ってもらうだけで,その中に私が埋込んだ階層的構造や,用語同士の関係性が,自然と勝手に身に付くはずである.

[2] 記事内(local)の構造化:歴史順の説明や,関連技術のグループ分類.

記事間の階層構造化や結びつきも重視する一方で,それぞれの記事内(local)の構造化にも,力を入れている.ディープラーニングやビジョンのテキストは内容過多なせいもあって,各用語の説明が一瞬で終わってしまい(ひどければ類似手法リストの列挙だけでおわる),各層やアルゴリズムの詳細もわからないまま,断片的な項目の羅列で終わってしまっていることが多い.

それを避けるために,このサイトの用語集では,百科事典(Wiki)テキストガイドブックのいいところどり(良いバランス)を狙っている.また,きちんと章立てして,節番号と見出しから内容がわかりよい(論文の構成のような)記事にしている.「1節が導入,最後の章で結論とまとめ(や追加の議論)」という構成に,各記事を統一している.

そして,短時間の理解を助けるためわかりやすい図の作成にも力を入れている.各記事の内容が,(用語のサマリーでもある)図1を通して,記憶に定着しやすいようにしている.

各節も,簡単な説明に終わらず,細かいところまでは行き過ぎず.また,わかりやすく簡潔に,また無駄な点は省いて重要点だけを取り上げるようにしている.

また,各用語記事では,歴史的な経緯の説明にも力を入れている(例:人物姿勢推定インスタンスセグメンテーションなど).管理人としては,その問題設定が初めて提案されたころの,初期の手法(=解き方)が,特に大事だと考えており,物体検出など「問題(タスク)」の記事では,少なくとも,ディープラーニング時代での初期の解き方は,必ず触れるようにしている.(※ 記事が溜まってきたら、複数の記事を時系列準でつなぐツアー的な用語記事・Q&A記事も増やしたい).

また,モジュール結合であるディープラーニングでは,各層やブロックについて「なぜ採用するか」を把握しているのが,ネットワーク全体の設計で大事である.これは,損失関数についても同じことが言える.よって,それらの部品や学習系の記事でも,きちんとグループ分類をおこない,各部品がどのように違い,どれを選べばよいかを,読者が考えられる記事構成にしている.

2.2 おすすめの使用法

この用語集は,規模が大きいのもあり,全部を読み用途には向いていない.また,将来的にはWebコースを用意して,この用語集は教科書として使用していただくようにしたいが,現時点ではそういった半年単位の授業と連携していないので,網羅的に用語集の内容を全て身につけていくのは,かなりしんどいはずである.

よって,ご自身のフォーカスに沿って,自身に現時点で必要な内容のみコツコツと探索的・検索的ににたどっていく使用法がオススメである.特に初心者に近い方ほど,このサイトの用語集は,一気読みは不可能なほどの内容の多さと深さであるはずである.つまりは,繰り返し各記事を探索的にたどりながら読み返していただくことで,各記事に埋めてある勘所を少しずつ掴んでいって頂きたい.逆に既にプロのビジョン系研究者の方の場合は,好きなように活用していただければ幸いである.

あと,1.2で述べたように,記事間も記事内も構造化しているゆえ,用語記事の各カテゴリーのトップページ(2節)は重要拠点である.したがって,いつでもすぐ各記事にクイックアクセスできるように,トップツールバーにも,用語記事の各カテゴリトップページ(=目次)へのリンクを列挙している.

ちなみに,各記事で用いる「数式の記法」の標準的なルールは,以下のページに別途まとめている(※ ただし,著者もたまにこの記法から脱線するときもある):

関連記事:このサイトにおける数式の記法

3.「用語集」の狙い.

本サイトの用語集カテゴリーの記事は,管理人として以下のような狙いがある:

狙い1管理人の主観的判断でキーワードとなる用語を厳選して簡潔に紹介する.代表的な,今後10年以上は役に立つ基礎用語を,簡潔に解説した記事を階層化した用語辞典として提供する.これにより,読者の学習や復習だけでなく,今後の探求活動で役立にたつガイドマップサイトにしたい.狙い2にもあるように,サイト全体として,各用語を体系的に構造して捉えられるようにしていきたい(それを通して,著者自身の各用語の理解も深めていきたい).読者の方々が,各用語の情報を「(1)このサイトから」もしくは「(2)脳から直接」必要な時に引き出しやすくすることも狙いたい.

狙い2:Wikipediaのように各用語は詳しくは説明はしないが,用語ページ間はしっかりハイパーリンクさせることで,用語間の関連づけに焦点が当たりやすくする.各記事を横串にさしてまとめる記事も書いていくつもりであるが,そもそも各記事にある用語ページのWikiリンクを通じて,読者の理解が深待っていくことを期待する.

狙い3:「自分の目的に沿った情報にフォーカスを当てよう」と,改めて意識していただくことを狙う.研究者の方々や,研究者を目指したり研究結果を応用する側のR&D系の方々は,論文や情報の時系列的な羅列は,それこそarxivの最新のpreprintをチェックするだけでなく,各種サイトやSNSなどでも最新の研究の解説の情報を得ていると思われる.しかし,管理人はそれらの大量の情報の波に溺れているだけの方が多いことを危惧している.情報は自分なりに解釈して整理し取捨選択して,初めて良いアウトプットにつながるので,ぜひ当サイトの用語集を,その整理に活用していただきたい(ご自身でノート化していくことを,強く勧める).

4. 用語集の各記事ページの構成

上記のような狙いを踏まえて、各用語を紹介する記事ページは以下のような構成にしてある:

  • 用語の説明自体は「テキスト・教科書のような解説」(※ Wikipediaのように膨大で網羅的なページ構成にはせず,各記事は教科書代わりの内容).
  • 関連する用語ページへは,(サイト内)ハイパーリンクを貼る.
  • その記事ページで紹介されている用語(多くはアルゴリズムであるが)について,詳細な解説を学ぶことができるコンテンツがWeb上にあれば記事最後の「外部リンク先」にリストアップ.
  • 対照的な用語があれば、その用語との簡単な対比も記事中で提示して私なりの比較も加えるようにしている.

繰り返しになるが,Wikipediaでありがちな「詳細で長大な数万時レベルの記事」になることはできるだけ避けて,各用語記事は,「自作の図」と「リスト」も駆使することで,多すぎない文字量の記事にするように心がけている(多くとも1万字以内にとどめる).逆に言うと,1万字を超えると,その一部分を子記事に分割するようにしている.