ある企業が RAG(検索拡張生成)アーキテクチャを使って社内ナレッジベースに基づく Q&A システムを構築している。悪意あるユーザーが検索インデックスに偽の文書を混入させ、モデルに誤った回答をさせようとする攻撃を防ぐために取るべき対策の組み合わせとして最も適切なものはどれか。
- A. ベクターストアへの書き込みを許可する IAM ロールを厳格に制限し、文書の取り込みパイプラインに承認ワークフローと自動コンテンツ検証を組み込む
- B. LLM のコンテキストウィンドウのサイズを小さくして、参照できる文書数を制限する
- C. Amazon Macie でベクターストアをスキャンして偽文書を検出する
- D. RAG パイプラインを VPC 内に閉じてインターネットからのアクセスを遮断する
解答と解説を見る
正解: A
RAG への文書汚染攻撃(データポイズニング)への対策として最も有効なのは、ベクターストアへの書き込み権限を最小権限で管理し、文書取り込みパイプラインに承認ワークフローと自動コンテンツ検証(有害コンテンツのスクリーニング、出所確認)を設けること。攻撃者が悪意ある文書を混入させる経路を IAM と承認プロセスで遮断できる。Bのコンテキスト制限は攻撃防止ではなく検索品質の低下を招くだけ。CのMacieはS3内のPII検出用であり、ベクターデータベース内の偽文書を特定する機能はない。DのVPC隔離はインターネット経由の外部アクセスを遮断できるが、内部の正規ユーザーによる意図的な文書混入は防げない。
📚 関連サービスの解説: AWS IAM