Question

ある企業が、大規模なコーパス（100GB の PDF テキスト）を対象とした社内検索 RAG システムを Amazon Bedrock と OpenSearch Serverless で構築している。検索精度を最大化するための設計手法を2つ選択してください。

Accepted Answer

ドキュメントを固定長ではなくセマンティックチャンキング（意味的な区切りで分割）し、チャンクが文脈的に完結するようにする

Accepted Answer

ハイブリッド検索（ベクトル類似度検索＋BM25 キーワード検索）を組み合わせて、意味的一致とキーワード一致の両方をカバーする

Answer

すべてのチャンクをランダムに並び替えてインデックスに格納することで、検索の多様性を高める

Answer

Embedding モデルを毎月替えながら同じベクトルストアを使い続け、最新モデルの恩恵を受ける

Answer

チャンクサイズを 5 トークン以下に細分化して、検索候補の粒度を最大限に細かくする

ある企業が、大規模なコーパス（100GB の PDF テキスト）を対象とした社内検索 RAG システムを Amazon Bedrock と OpenSearch Serverless で構築している。検索精度を最大化するための設計手法を2つ選択してください。

同じ分野の関連問題