✳️ ディープラーニングの用語記事の一覧 ✳️

ディープラーニング (Deep learning) に属する用語集の記事一覧を,階層的に記事リンクつきで示している,「用語記事のリンク一覧」ページです.このサイトの主テーマである,コンピュータビジョン (Computer Vision)むけのディープラーニング用語記事が中心です.よって,このページは「Deep Learning for Computer Vision」とも言えるページです.

一方で,ディープラーニング登場後(とりわけ系列変換-アテンションTransformerの流行以降),各分野の解きかたが似てきたせいで,お互いの境界線が薄まってきている自然言語処理音声認識音響処理系などの「コンピュータビジョン周辺のパターン認識分野」の技術(=用語)の記事も多めです.用語集の「上位階層の各記事へのショートカット」としても,日常的に繰り返し使用していただけると思います.

(※ リンクはまだ無いが,タイトル案だけ列挙してあるのは,今後書きたい記事の候補です)

先に0.1節と0.2節で「トップ2階層のみを列挙したリスト」を,全体俯瞰しやすいようにリスト化してます.その後,1節(モデル)と2節(タスク)で,全用語をリスト化します.

ディープラーニング流行以前からある,伝統的内容のコンピュータビジョンについては,コンピュータビジョンの用語記事の一覧を参照してください.

ディープラーニング以前のものも含めた,自然言語処理の用語については,自然言語処理の用語記事の一覧を参照してください.

0. トップ階層のディープラーニング用語

0.1 モデル (トップ階層のみ)

0.2 タスク (トップ階層のみ)

1. ディープラーニングのモデル (もといネットワーク)

1.4 学習方法

1.4.1 基本: 教師あり最適化

1.8 距離学習

  • ランキング学習ネットワーク:
    • Siamese Network
    • Triplet loss

1.9 3D点群入力向けモデル

  • PointNet
  • VoteNet

2. ディープラーニングのタスク

2.1 物体認識

2.5 人物姿勢推定

2.6 動画からの行動理解

  • 3D動画表現CNN
    • C3D
    • I3D
    • ResNet3D
  • 行動認識(Action Recognition)
  • 行動検出(Action Detection)
  • 行動分割(Action Segmentation)

2.7 画像対画像変換モデル

  • 画像対画像変換(Image-to-Image Translation)
    • pix2pix
    • pix2pixHD
  • 画像スタイル変換
  • 画像補間ネットワーク
  • 超解像ネットワーク

2.8 3D点群処理(ディープラーニング )

  • PointNet
  • VoteNet

3. マルチモーダル・クロスモーダルなディープラーニング

3.1 Vision and Language

3.1.1 画像キャプション生成

3.1.2 画像グラウンディング

  • 画像グラウンディング (Image Grounding)

3.1.3 画像-テキスト間埋め込み

  • 画像-テキスト間埋め込み (Image-Text Embedding)