このページでは用語集の「自然言語処理」カテゴリに属する用語記事へのリンクを,階層的に示す.
目次
1. 分散表現
- ワード単位の分散表現(単語埋め込み)
2. 統語解析 (Syntactic)
2.1 品詞解析
- 品詞タグ付け(Part-of-Speech Tagging)
- 係り受け解析(Dependency Parsing)
3. トークナイザ・形態素解析
3.1 トークナイぜーション(英語など,空白で文節を区切れる言語むけ)
- 伝統的なトークナイザ
- サブワード分割も行うトークナイザ
- WordPiece
- SentencePiece
3.2 形態素解析(主に日本語向けのものについて)
- ディープ以前の日本語形態素解析モデル(公開ツール)
- Juman
- MeCab
- ディープ以降の形態素解析モデル
3. 系列対系列変換モデル
- アテンション機構 (Attention Mechanism)と系列対系列変換 for 機械翻訳
- RNNLM(再帰型ニューラル言語モデル)
- 言語モデル・翻訳モデルの評価
- パープレキシティ
- BLEU
4. 意味表現(semantic representation)の解析
固有表現認識(Named Entity Recognition)
4.2 関係抽出
4.3 Semantic Role Labeling
5. Transformer・BERT時代の「非パイプライン型」のNLP
5.1 発展的なNLPタスク
- 機械翻訳
- 質問応答
5.2 一般化言語モデル(BERT・GPT-3など)の自己教師有り学習による事前学習
- 一般化言語モデルによる文脈化表現の学習
- BERT
- GPT-3
- 一般化言語モデル向けのチューニング(転移学習)
- アダプター(Apdater)
- プロンプト(prompt)を用いたfew-shot Adaptation.
5.3 複数言語モデル
- multi-lingal BERT
- mT5