ある金融機関が Amazon Bedrock を使って規制対応レポートを自動生成するシステムを構築している。生成されたレポートには「情報源を必ず引用し、出典となる内部ドキュメントのファイル名とページ番号を記載する」という規制要件がある。この要件を満たすために最も適切なアーキテクチャはどれか。
- A. モデルのプロンプトに「引用元を必ず記載してください」と指示し、モデルが自律的に出典を生成するようにする
- B. Amazon Comprehend で生成テキストの固有表現を抽出し、それをドキュメントDB で検索して出典を自動補完する
- C. ファインチューニングで引用付きレポートのサンプルを学習させ、モデルが自動的に引用を生成できるようにする
- D. Amazon Bedrock Knowledge Bases の引用(Citations)機能を使い、RAG 検索で使用したソースドキュメントのメタデータ(ファイル名・ページ番号等)を回答とともに返す
解答と解説を見る
正解: D
Amazon Bedrock Knowledge Bases には検索に使用したソースドキュメントのメタデータ(S3 オブジェクトの URI・ページ番号等)を回答とともに返す「引用(Citations)」機能が組み込まれている。RAG で参照した実際のドキュメントチャンクのソースを追跡できるため、規制要件の「引用元の明示」を確実かつ自動的に満たすことができる。Aのプロンプト指示によるモデルへの自律的な引用生成は「幻覚(ハルシネーション)」のリスクがある。モデルが存在しない出典を「でっち上げる」可能性があり、規制対応としては信頼できない。Cのファインチューニングによる引用生成も同様に幻覚リスクが残る。引用元の正確性をモデルが保証することはできない。BのComprehend + ドキュメントDB 検索は独自のマッチングロジックが必要で実装コストが高く、また抽出精度の問題から誤った出典が付与されるリスクがある。
📚 関連サービスの解説: Amazon Bedrock