Transformer とseq2seq with attention の違いは?[系列変換モデル]【Q and A 記事】

1. Question 系列変換モデルであるTransformer と seq2seq with atteniton の違いは? という疑問について,管理人なりの回答(もとい両者の比較)を答えたい. つまり,新旧2つの系 続きを読む…

Transformer : 系列変換モデル向けEncoder-Decoder [深層学習]

1. Transformer (深層学習)とは [概要] Transformer とは,機械翻訳などの系列変換モデルの深層学習に用いる,マルチヘッドアテンションを主部品として用いるDeep Encoder-Decoder 続きを読む…

softmax 関数 (ソフトマックス関数) [活性化関数]

1. softmax 関数 (ソフトマックス関数)とは [概要] softmax 関数とは,機械学習の「多クラス識別モデル」において,確率的なベクトル出力をする際によく用いられる,Maxをソフトに行う出力が行える活性化関 続きを読む…