AIF-C01基盤モデルの応用MEDIUM単一選択

ある企業が Amazon Bedrock でテキスト生成タスクを処理しており、top-p（nucleus sampling）パラメータの効果を理解したい。top-p パラメータの動作として正しいものはどれか。

A. ランダム性を p% の確率で適用し、残り (1-p)% はグリーディサーチを行う
B. 上位 p% の確率を持つトークンの累積確率が p になるまでトークン候補を絞り込み、その中からランダムに選択する。p を小さくすると候補が絞られ出力が安定する
C. p 個の最も頻度の高い単語のみを出力候補とし、珍しい単語は除外する
D. 生成するトークン数の上限を p 個に制限し、応答の長さをコントロールする

解答と解説を見る

正解: B

top-p（nucleus sampling）は確率分布の累積確率が p に達するまでのトークン群（nucleus）の中からサンプリングする手法。例えば top-p=0.9 の場合、確率の高いトークンから順に累積確率が 90% になるまでのトークン群を候補とし、その中からランダムに選ぶ。p を小さくすると候補数が減り出力が安定し、p を大きくすると多様な表現が生まれる。top-p と temperature は両方使われることが多く、相互に影響する。Dの「トークン数上限」は maxTokens パラメータの説明であり top-p とは別。Aのランダム性の確率的適用というのは top-p の正確な動作ではなく、概念の混同。Cの「上位 p 個の単語」は top-k サンプリングの説明であり top-p とは異なる（top-p は個数ではなく累積確率で絞る）。

▸ この試験を本気で演習する（全150問・無料）

ある企業が Amazon Bedrock でテキスト生成タスクを処理しており、top-p（nucleus sampling）パラメータの効果を理解したい。top-p パラメータの動作として正しいものはどれか。

同じ分野の関連問題