ある企業が Amazon Bedrock を使ってチャットボットを開発している。モデルの回答に不適切な内容(有害な情報、競合他社への言及)が含まれないよう制御したい。最も適切な最初の対策はどれか。
- A. Knowledge Bases に「禁止事項リスト」を格納して RAG で毎回参照させる
- B. temperature を 0 に設定して出力を固定化する
- C. Amazon Bedrock の Guardrails 機能を設定し、入出力のフィルタリングルールを定義する
- D. モデルをファインチューニングして不適切な回答パターンを削除する
解答と解説を見る
正解: C
Amazon Bedrock Guardrails は入力(ユーザーのプロンプト)と出力(モデルの回答)の両方に対して、有害コンテンツのフィルタリング・特定トピックのブロック・機密情報のマスキング・不適切な言語の検出などをマネージドで設定できる安全機能。不適切コンテンツ制御の第一選択として最も適切。Dのファインチューニングはモデルの動作全般を変更する大がかりな手法で、コンテンツフィルタリングという目的に対しては過剰な対応であり、また完全な制御が保証されない。Bの temperature=0 は出力のランダム性を下げるだけで不適切コンテンツを「禁止」する機能はない。Aのフィルタリストの RAG 参照は不確実であり、RAG の設計思想とも異なる。Guardrails のような専用機能を使うべき場面でプロンプト工夫で代替しようとする方法は信頼性が低い。
📚 関連サービスの解説: Amazon Bedrock