AIF-C01責任ある AI に関するガイドラインMEDIUM単一選択

あるチームが、Amazon Bedrock Guardrails の「拒否トピック（Denied Topics）」機能を設定しました。設定後、ユーザーが拒否対象トピックに関する質問を送信したとき、モデルはどのように動作しますか？

A. モデルは回答を生成するが、その回答がログに記録されて管理者に通知される
B. Guardrails はモデルの重みを動的に更新して、以降の同様の質問に回答しないようにする
C. モデルは質問に通常通り回答した後、末尾に免責事項を自動付加する
D. Guardrails が入力をインターセプトし、モデルへ渡さずに設定された拒否メッセージを返す

解答と解説を見る

正解: D

Amazon Bedrock Guardrails の拒否トピック機能は、対象トピックを含む入力プロンプトをモデルに渡す前にインターセプトし、事前に設定した拒否メッセージ（カスタムまたはデフォルト）を返します。モデルそのものは一切呼び出されません。Cのように回答してから免責を付加するのは Guardrails の動作ではなく、プロンプトエンジニアリングレベルの対処です。Aのログ通知のみで回答させることは拒否トピックの目的（回答させない）と矛盾します。Bのモデル重みの動的更新は Guardrails の仕組みとして技術的に不正確であり、Bedrock のマネージドモデルに対してリアルタイムでファインチューニングを行う機能はありません。

▸ この試験を本気で演習する（全150問・無料）

あるチームが、Amazon Bedrock Guardrails の「拒否トピック（Denied Topics）」機能を設定しました。設定後、ユーザーが拒否対象トピックに関する質問を送信したとき、モデルはどのように動作しますか？

同じ分野の関連問題