ある AI エンジニアが、Amazon Bedrock でホストされた LLM チャットボットに対するプロンプトインジェクション攻撃を防ぎたいと考えています。Bedrock Guardrails の「グラウンディングチェック(Grounding Check)」機能は、このユースケースに対してどのような役割を果たしますか?
- A. ユーザーの IP アドレスを照合して既知の攻撃者からのアクセスをブロックする
- B. モデルが回答を生成する際に、提供されたソースドキュメントの内容に基づいているかを評価し、根拠のない幻覚(hallucination)を検出・拒否する
- C. モデルの出力をリアルタイムで外部ファクトチェック API に送信して真偽を確認する
- D. ユーザー入力に悪意のあるコードが含まれていないかを構文解析して除去する
解答と解説を見る
正解: B
Bedrock Guardrails のグラウンディングチェックは、RAG(検索拡張生成)シナリオにおいてモデルの出力が提供されたグラウンディングソース(参照文書)に基づいているかを評価します。ソースに存在しない情報を作り出す幻覚や、文書と矛盾する回答を検出・ブロックする機能です。プロンプトインジェクション対策の直接的な武器ではありませんが、根拠のない出力を防ぐことでRAGシステムの信頼性を高めます。Dの構文解析によるコード除去はプロンプトインジェクション対策に近いですが、グラウンディングチェックの機能説明としては誤りです。CとAはグラウンディングチェックの実際の動作とまったく異なります。