✳️ ディープラーニングの用語記事 ✳️ の一覧

記事を共有する:

このページの概要

ディープラーニング (Deep learning) に属する📚用語Wikiの記事一覧を,階層的に記事リンクつきで示すページです.サイトの主テーマ「コンピュータビジョン」や「画像認識」むけの用語Wiki記事が中心です.

自然言語処理音声認識音響処理系などの用語記事も多めになっています.ディープラーニング登場後は,とりわけ系列変換モデルとアテンションTransformerの流行以降に,コンピュータビジョンと解法が似てきていて,マルチモーダルやマルチタスク学習で,共通化,統合化(Unify)もされつつあります,

このページは用語集の「上位階層の各記事へのショートカット」としても,日常的に使用していただけると思います.

ディープラーニング流行以前からある,伝統的コンピュータビジョンについては,コンピュータビジョンの用語記事の一覧を参照してください.また,自然言語処理の用語については,自然言語処理の用語記事の一覧を参照してください.

先に0.1節と0.2節で「トップ2階層のみを列挙したリスト」を,全体俯瞰しやすいようにリスト化してます.その後,1節(モデル)と2節(タスク)で,全用語をリスト化します.

※ リンクはまだ無いが,タイトル案だけ列挙してあるのは,今後書きたい記事の候補

0. トップ階層のみ厳選

1. モデル(=ネットワーク)

1.3 学習方法

1.6 距離学習

  • ランキング学習ネットワーク:
    • Siamese Network
    • Triplet loss

2. ディープラーニングのタスク

2.1 物体認識

2.4 人物姿勢推定

2.5 動画からの行動理解

  • 3D動画表現CNN
    • C3D
    • I3D
    • ResNet3D
  • 行動認識(Action Recognition)
  • 行動検出(Action Detection)
  • 行動分割(Action Segmentation)

2.6 画像対画像変換モデル

  • 画像対画像変換(Image-to-Image Translation)
    • pix2pix
    • pix2pixHD
  • 画像スタイル変換
  • 画像補間ネットワーク
  • 超解像ネットワーク

2.7 3D点群処理(ディープラーニング )

  • PointNet
  • VoteNet

3. マルチモーダル・クロスモーダルなディープラーニング

3.1 Vision and Language

3.1.1 画像キャプション生成

3.1.2 画像グラウンディング

  • 画像グラウンディング (Image Grounding)

3.1.3 画像テキスト間埋め込み

  • 画像テキスト間埋め込み (Image-Text Embedding) 視覚意味間埋め込み[Visual Semantic Embedding]