Microsoft AzureAI・機械学習演習13問

Azure AI Visionとは

Azure AI Visionは、画像・動画の分析に特化したAIサービスだ。物体検出・画像分類・OCR（光学的文字認識）・画像キャプション生成などの機能を提供する。現在の中核はImage Analysis 4.0で、キャプション生成・タグ付け・物体検出・OCRといった機能が単一のAPIに統合されている。Custom Visionを使うと独自の画像分類・物体検出モデルを、ノーコードで作成・デプロイできる。

Azure AI Faceは顔検出・顔認識・感情推定などの顔関連のAI機能を提供するサービスで、Azure AI Visionとは別のサービスとして提供される。責任あるAIの観点から、なりすまし防止のための本人確認（identity verification）など一部の機能は限定的なシナリオのみにアクセス制限（申請制）がかかっている。

公式ドキュメント →

試験での問われ方

AI-900ではコンピュータービジョンのユースケースを問われる。画像の中に何が写っているか（物体検出・画像分類）、画像内のテキストを読み取る（OCR）、顔を検出・識別する（Face）という3つの用途と対応するサービスを整理しておく。Custom Visionで独自データセットを使ってモデルを訓練できるという点も出題される。

Azure AI VisionとDocument Intelligence（旧Form Recognizer）の守備範囲の違いも問われる。Vision/OCRは画像中の文字を「読み取る」までが守備範囲なのに対し、Document Intelligenceは請求書・領収書・身分証・フォームなど構造のある文書から、項目名と値のペアや表をキー・バリューとして「構造化して抽出」することに特化している。『書類から金額や日付を項目として取り出したい』ならDocument Intelligenceが正解になる。

Azure AI Visionとは

試験での問われ方

このサービスが登場する演習問題（13問）

関連サービス