ある行政機関が、紙の申請書をデジタル化するシステムを構築したい。スキャンされた申請書の画像から住所・氏名・日付などの記入内容を自動抽出して、データベースに格納することが目的である。このユースケースに最も適したコンピュータ ビジョン機能はどれか。
- A. 顔認識:申請書に貼付された写真から本人を識別する
- B. 光学式文字認識(OCR):画像内の印刷・手書き文字をテキストとして抽出する
- C. 画像分類:申請書の種類をカテゴリ分けする
- D. 物体検出:申請書内のオブジェクトの位置を特定する
解答と解説を見る
正解: B
OCR(光学式文字認識)は、スキャン画像やデジタル写真に含まれる印刷文字や手書き文字をテキストデータとして抽出する技術であり、紙の申請書デジタル化に最適である。Azure AI VisionのRead APIがこの機能を提供する。画像分類は申請書をカテゴリ分けするだけでテキスト抽出はできない。物体検出はオブジェクトの位置を特定するが、文字をテキストとして読み取る機能ではない。顔認識は写真の人物識別に特化しており、申請書本文のテキスト抽出とは全く異なる用途である。