end-to-end learning (端対端学習)

1. end-to-end learning (端対端学習) とは [概要] end-to-end learning (端対端学習) とは,ディープラーニングにおいて,1つの問題やタスクに対して,ネットワーク中の入力層( 続きを読む…

平均プーリング(Average Pooling)

1. 平均プーリング(Average Pooling) とは 平均プーリング(Average Pooling) とは,CNN(畳み込みニューラルネットワーク)で用いられる,中間層むけの局所プーリング層である.スライディン 続きを読む…

系列変換モデルとアテンション機構 [seq2seq から Transformer まで]

1. 系列変換モデルとアテンション機構の概要 系列変換モデルとアテンション機構について,この記事では2つ同時に解説する.また,系列変換モデルのうち,seq2seqの応用・発展を、登場順に以下の3節を通じて解説する. 2節 続きを読む…

Transformer : アテンションが主要部品の系列変換モデル

1. Transformer とは [概要] Transformer とはアテンションを主要部品として用いた,深層学習むけの(トークン)系列変換モデルである.この記事では,機械翻訳むけのTransformer [Vasw 続きを読む…

softmax 関数 (ソフトマックス関数) [活性化関数]

1. softmax 関数 (ソフトマックス関数)とは [概要] softmax 関数とは,機械学習の「多クラス識別モデル」において,確率的なベクトル出力をする際によく用いられる,Maxをソフトに行う出力が行える活性化関 続きを読む…