ある企業の AI リードエンジニアが、カスタマーサポートに導入した生成 AI チャットボットの「安全性ガードレール」を設計している。ユーザーが意図的に有害コンテンツを引き出そうとするプロンプトインジェクション攻撃を防ぐための、最も効果的な対策の組み合わせはどれか。
- A. LLM への入力トークン数を厳しく制限(例:50 トークン以下)し、長文攻撃を物理的に遮断する
- B. チャットボットのログを週次でサンプリングレビューし、問題が発生したときに事後対応する
- C. システムプロンプトでロールと行動範囲を厳密に定義し、Amazon Bedrock Guardrails でコンテンツフィルタリングとトピック拒否ルールを設定する
- D. ユーザーの入力を LLM に渡す前に、すべての特殊文字と句読点を削除するサニタイズ処理のみを行う
解答と解説を見る
正解: C
プロンプトインジェクション対策には、システムプロンプトによるロール固定(モデルが従うべき文脈と禁止事項の明示)と、Bedrock Guardrails によるコンテンツフィルター・禁止トピックルールを組み合わせる多層防御が最も効果的である。Dは誤り:特殊文字の削除はインジェクション攻撃の一形態を防ぐが、自然言語のみで構成された攻撃プロンプトには無効であり不十分。Aは誤り:50 トークン制限は正当なユーザーの利便性を大きく損ない、サービス品質を破壊する。Bは誤り:事後対応のみでは攻撃が発生した後の対策であり、リアルタイムの被害防止にならない。
📚 関連サービスの解説: Amazon Bedrock