ある企業が、大規模な言語モデル(LLM)を活用したRAG(検索拡張生成)システムを構築しています。社内ドキュメントからの質問応答の精度を高めるために、Vertex AIを使った最も効果的なアーキテクチャとして正しいものはどれですか?
- A. 社内ドキュメント全文をLLMのプロンプトに毎回直接埋め込み、コンテキストとして送信する
- B. Geminiのファインチューニングのみで社内知識を学習させ、ベクトル検索は使用しない
- C. 社内ドキュメントをVertex AI Searchでインデックス化し、ユーザークエリに関連するチャンクを検索してGeminiのコンテキストとして渡し、回答を生成させるRAGパイプラインを構築する
- D. 社内ドキュメントをすべてBigQueryのテーブルに変換し、Gemini APIを使わずSQLのみで質問応答する
解答と解説を見る
正解: C
RAGの標準的なアーキテクチャは、①ドキュメントをチャンク分割してベクトル化(埋め込み)→③ベクトルストア(Vertex AI SearchのAlloyDB、Vertex AI Vector Search等)にインデックス登録→②ユーザークエリをベクトル化して類似チャンクを検索→④検索結果をGeminiのコンテキストとして与えて回答生成、という流れ。全文プロンプト埋め込みはLLMのコンテキスト長制限を超える場合があり非効率。ファインチューニングのみでは最新情報への対応や引用明示が難しい。BigQuery SQLのみでは自然言語理解・生成ができない。
📚 関連サービスの解説: Vertex AI