Question

ある企業が、Bedrock 上のモデルを利用して長文の法律文書から重要条項を自動抽出するシステムを構築した。しかし文書が 200 ページを超えるケースで処理が失敗または精度が低下している。最もコスト効率よく問題を解決するアプローチはどれか。

Accepted Answer

文書をセマンティックチャンキングで分割し、関連チャンクのみを取得して LLM に渡す RAG アーキテクチャを導入する

Answer

200 ページを超える文書は人間のレビュアーに振り分け、システムの処理対象から除外する

Answer

コンテキストウィンドウが無限大のモデルが将来出るまで開発を凍結する

Answer

GPU を増設して推論を高速化し、長文でもタイムアウトしないようにする

同じ分野の関連問題