ある金融機関が Amazon Bedrock を使ったチャットボットに対して社内専門用語で問い合わせると、一般的な回答しか返ってこないという問題が発生している。このチームは社内用語・略語・独自の意思決定フレームワークを含む数百ページの内部文書を持っている。最も費用対効果の高い解決策はどれか。
- A. プロンプトに用語集全文を毎回貼り付けてモデルに送信する
- B. 社内専門用語を扱えるようゼロから LLM を事前学習させる
- C. Amazon Bedrock のファインチューニングで内部文書を学習させて専門用語の理解を深める
- D. Knowledge Bases for Amazon Bedrock に内部文書をアップロードし、RAG でクエリに関連する文書チャンクを検索・参照させる
解答と解説を見る
正解: D
Knowledge Bases for Amazon Bedrock は S3 にある文書を自動的にチャンク分割・ベクトル化してベクトルDB(Amazon OpenSearch Serverless 等)に格納し、クエリと意味的に近い文書チャンクを検索してモデルに渡す RAG パイプラインをフルマネージドで提供する。内部文書の追加・更新も容易で、再学習不要のため最も費用対効果が高い。Cのファインチューニングは挙動・形式の学習には有効だが、数百ページの事実情報を確実に記憶させるには不十分で、コストも高い。Aの全文貼り付けはモデルのコンテキスト長上限(数百ページ分は到底入らない)を超えるため現実的でない。Bのゼロからの事前学習は莫大なコストと計算資源が必要で、企業が独自に実施するのは非現実的。
📚 関連サービスの解説: Amazon Bedrock