Question

ある企業が Amazon Bedrock を使って顧客向けのチャットボットを構築している。悪意あるユーザーが「これまでの指示を無視して...」のようなテキストを入力してモデルの挙動を操作しようとする攻撃への対策として最も適切なものはどれか。

Accepted Answer

システムプロンプトで役割とルールを明確に定義し、Bedrock Guardrails でコンテンツフィルタリングと入力検証を設定する

Answer

チャットボットのエンドポイントを VPC 内に閉じてインターネットアクセスをなくす

Answer

モデルのトレーニングデータから悪意あるサンプルをすべて削除する

Answer

レスポンスの最大トークン数を制限してモデルが長い回答を生成できないようにする

同じ分野の関連問題