ある小売企業が、倉庫内を流れるコンベア上の商品パッケージを自動的に識別するシステムを導入したい。カメラで撮影した画像から「どの製品カテゴリか」を判定することが主な目的である。このユースケースに最も適したコンピュータ ビジョン タスクはどれか。
- A. 画像分類(Image Classification):画像全体に対して1つのラベルを付与する
- B. セマンティック セグメンテーション:画像の各ピクセルを分類する
- C. 物体検出(Object Detection):画像内の複数オブジェクトの位置と種類を特定する
- D. 光学式文字認識(OCR):画像内のテキストを読み取る
解答と解説を見る
正解: A
画像分類は画像全体に対して単一のカテゴリラベルを付与するタスクであり、「この画像はどのカテゴリか」を判定する本シナリオに最適である。物体検出は画像内に複数のオブジェクトが存在し、それぞれの位置(バウンディングボックス)と種類を同時に特定する必要がある場合に使う。製品カテゴリの識別だけが目的であれば、位置特定は不要なため物体検出は過剰である。OCRはテキスト読み取り専用であり商品カテゴリ識別には不適切。セマンティック セグメンテーションはピクセル単位の分類で、このユースケースより処理コストが高く目的に合わない。