Microsoft AzureAI・機械学習

Azure AI Visionとは

Azure AI Visionは、画像・動画の分析に特化したAIサービスだ。物体検出・画像分類・OCR(光学的文字認識)・画像キャプション生成などの機能を提供する。現在の中核はImage Analysis 4.0で、キャプション生成・タグ付け・物体検出・OCRといった機能が単一のAPIに統合されている。Custom Visionを使うと独自の画像分類・物体検出モデルを、ノーコードで作成・デプロイできる。

Azure AI Faceは顔検出・顔認識・感情推定などの顔関連のAI機能を提供するサービスで、Azure AI Visionとは別のサービスとして提供される。責任あるAIの観点から、なりすまし防止のための本人確認(identity verification)など一部の機能は限定的なシナリオのみにアクセス制限(申請制)がかかっている。

試験での問われ方

AI-900ではコンピュータービジョンのユースケースを問われる。画像の中に何が写っているか(物体検出・画像分類)、画像内のテキストを読み取る(OCR)、顔を検出・識別する(Face)という3つの用途と対応するサービスを整理しておく。Custom Visionで独自データセットを使ってモデルを訓練できるという点も出題される。

Azure AI VisionとDocument Intelligence(旧Form Recognizer)の守備範囲の違いも問われる。Vision/OCRは画像中の文字を「読み取る」までが守備範囲なのに対し、Document Intelligenceは請求書・領収書・身分証・フォームなど構造のある文書から、項目名と値のペアや表をキー・バリューとして「構造化して抽出」することに特化している。『書類から金額や日付を項目として取り出したい』ならDocument Intelligenceが正解になる。

このサービスが登場する演習問題(13問)

関連サービス