AIF-C01責任ある AI に関するガイドラインMEDIUM単一選択

あるチームが、Amazon Bedrock Guardrails の「拒否トピック(Denied Topics)」機能を設定しました。設定後、ユーザーが拒否対象トピックに関する質問を送信したとき、モデルはどのように動作しますか?

  1. A. モデルは回答を生成するが、その回答がログに記録されて管理者に通知される
  2. B. Guardrails はモデルの重みを動的に更新して、以降の同様の質問に回答しないようにする
  3. C. モデルは質問に通常通り回答した後、末尾に免責事項を自動付加する
  4. D. Guardrails が入力をインターセプトし、モデルへ渡さずに設定された拒否メッセージを返す
解答と解説を見る

正解: D

Amazon Bedrock Guardrails の拒否トピック機能は、対象トピックを含む入力プロンプトをモデルに渡す前にインターセプトし、事前に設定した拒否メッセージ(カスタムまたはデフォルト)を返します。モデルそのものは一切呼び出されません。Cのように回答してから免責を付加するのは Guardrails の動作ではなく、プロンプトエンジニアリングレベルの対処です。Aのログ通知のみで回答させることは拒否トピックの目的(回答させない)と矛盾します。Bのモデル重みの動的更新は Guardrails の仕組みとして技術的に不正確であり、Bedrock のマネージドモデルに対してリアルタイムでファインチューニングを行う機能はありません。

▸ この試験を本気で演習する(全150問・無料)