ある金融サービス企業が、顧客向けチャットボットに生成 AI を導入することを検討している。規制上の理由から、モデルが出力した内容の引用元を必ず示せる仕組みが必要であり、かつ最小限のインフラ運用負荷で実現したい。最も適切なアプローチはどれか。
- A. プロンプトエンジニアリングのみで対応し、モデルに「引用元を明示して回答せよ」という指示を与えるだけにする
- B. 事前学習済みモデルをファインチューニングして社内知識を重みに組み込み、引用なしでも正確に答えられるようにする
- C. Amazon Bedrock の Knowledge Bases 機能を利用し、社内ドキュメントをベクトルストアに格納して RAG を構成する。各回答にソース引用メタデータを付加する
- D. LLM をオンプレミスの GPU サーバーにデプロイし、すべての推論リクエストを自社データセンターで処理する
解答と解説を見る
正解: C
Amazon Bedrock Knowledge Bases は、ドキュメントをチャンク分割・ベクトル化して OpenSearch Serverless 等に格納し、RAG パイプラインを自動構成するマネージドサービスである。レスポンスに出典(ソース URI・チャンク番号)が付与されるため引用要件を満たせる上、インフラ管理が不要。Dは誤り:オンプレミス運用はインフラ負荷が最大であり「最小限の運用負荷」要件に反する。Bは誤り:ファインチューニングで知識を重みに焼き込んでも、特定回答の引用元をモデルは保証できない(ハルシネーションリスクも残る)。Aは誤り:プロンプト指示だけでは LLM が架空の引用を生成するハルシネーションリスクが高く、規制要件を満たせない。
📚 関連サービスの解説: Amazon Bedrock