ある法律事務所が何千件もの契約書(PDF形式)から特定の条項を自動で見つけ出し、リスク項目を一覧化するシステムを構築したい。処理する文書は統一されたフォームではなく、様々な書式やレイアウトで作成されている。このユースケースに最も適したAIワークロードの種類はどれか。
- A. 生成AI:契約書の内容を要約した新しいリスクレポートを生成する
- B. 予測(機械学習):過去のリスク事例データから新しい契約書のリスクスコアを予測する
- C. コンピュータービジョン:契約書のレイアウトをスキャン画像として解析する
- D. ドキュメントインテリジェンス:様々な書式の文書から構造化情報を自動抽出する
解答と解説を見る
正解: D
様々なレイアウトの文書から特定の条項や情報を自動抽出してリスト化するのは「ドキュメントインテリジェンス」ワークロードの得意領域である。OCR技術と文書構造の理解を組み合わせて、異なる書式の文書からも一貫してキー情報を抽出できる。選択肢Cのコンピュータービジョンはページ画像を認識できるが、文書の意味的構造や特定条項の抽出という高度な文書理解はドキュメントインテリジェンスの専門機能である。選択肢Aの生成AIは要約生成に適するが、多数の文書からの正確な条項抽出・一覧化にはドキュメントインテリジェンスがより適切である。選択肢Bの予測(機械学習)はスコアリングに使えるが、文書からのテキスト抽出そのものには適さない。