AI-900機械学習の基本原則MEDIUM単一選択

あるNLPエンジニアがTransformerアーキテクチャについて学んでいる。Transformerが従来のRNN(再帰型ニューラルネットワーク)に比べて長文テキスト処理で優れている主な理由はどれか。

  1. A. Transformerはシーケンシャルに単語を処理するため、文脈の流れを正確に捉えられる
  2. B. Self-Attention機構によりシーケンス全体の依存関係を並列計算でき、長距離依存も効率的に捉えられる
  3. C. Transformerはルールベースの構文解析を組み込んでいるため、文法を正確に理解できる
  4. D. Transformerは感情分析専用に最適化された特殊なアーキテクチャである
解答と解説を見る

正解: B

TransformerのSelf-Attention機構は、シーケンス内のすべてのトークン間の関連度(アテンション重み)を一度に並列計算するため、RNNが苦手とする長距離依存(文の始まりと末尾の関係)を効率的に処理できる。また並列計算により訓練速度も大幅に向上する。AはRNNの特徴の説明であり、Transformerはシーケンシャルではなく並列処理が基本。CはTransformerにルールベースの構文解析は組み込まれておらず、完全にデータ駆動の学習を行う。DのTransformerは感情分析専用ではなく、機械翻訳・テキスト生成・画像認識など幅広いタスクで活用される汎用アーキテクチャである。

▸ この試験を本気で演習する(全150問・無料)