Question

あるデータサイエンティストが、Transformerアーキテクチャを使った大規模言語モデル（LLM）の事前学習について技術検討をしている。LLMの自己教師あり学習（Self-supervised Learning）において使われる代表的な事前学習タスクを2つ選択してください。

Accepted Answer

マスク言語モデリング（Masked Language Modeling）：入力テキストの一部をマスクして元のトークンを予測する

Accepted Answer

次トークン予測（Causal Language Modeling）：過去のトークン列を見て次のトークンを予測する

Answer

データ拡張と対照学習（SimCLR）：画像の変換ペアの類似度を最大化する

Answer

強化学習による行動最適化：環境からの報酬シグナルで言語モデルのパラメータを更新する

Answer

教師ラベルが付与されたデータでカテゴリ分類を行うマルチクラス分類事前学習

同じ分野の関連問題