あるチームが、Amazon Bedrock Guardrails の「拒否トピック(Denied Topics)」機能を設定しました。設定後、ユーザーが拒否対象トピックに関する質問を送信したとき、モデルはどのように動作しますか?
- A. モデルは回答を生成するが、その回答がログに記録されて管理者に通知される
- B. Guardrails はモデルの重みを動的に更新して、以降の同様の質問に回答しないようにする
- C. モデルは質問に通常通り回答した後、末尾に免責事項を自動付加する
- D. Guardrails が入力をインターセプトし、モデルへ渡さずに設定された拒否メッセージを返す
解答と解説を見る
正解: D
Amazon Bedrock Guardrails の拒否トピック機能は、対象トピックを含む入力プロンプトをモデルに渡す前にインターセプトし、事前に設定した拒否メッセージ(カスタムまたはデフォルト)を返します。モデルそのものは一切呼び出されません。Cのように回答してから免責を付加するのは Guardrails の動作ではなく、プロンプトエンジニアリングレベルの対処です。Aのログ通知のみで回答させることは拒否トピックの目的(回答させない)と矛盾します。Bのモデル重みの動的更新は Guardrails の仕組みとして技術的に不正確であり、Bedrock のマネージドモデルに対してリアルタイムでファインチューニングを行う機能はありません。