Question

ある企業の AI リードエンジニアが、カスタマーサポートに導入した生成 AI チャットボットの「安全性ガードレール」を設計している。ユーザーが意図的に有害コンテンツを引き出そうとするプロンプトインジェクション攻撃を防ぐための、最も効果的な対策の組み合わせはどれか。

Accepted Answer

システムプロンプトでロールと行動範囲を厳密に定義し、Amazon Bedrock Guardrails でコンテンツフィルタリングとトピック拒否ルールを設定する

Answer

LLM への入力トークン数を厳しく制限（例：50 トークン以下）し、長文攻撃を物理的に遮断する

Answer

チャットボットのログを週次でサンプリングレビューし、問題が発生したときに事後対応する

Answer

ユーザーの入力を LLM に渡す前に、すべての特殊文字と句読点を削除するサニタイズ処理のみを行う

同じ分野の関連問題