あるコンテンツモデレーション担当者が、ユーザー投稿動画の自動審査システムを Azure で構築したい。動画の審査に Azure Video Indexer を活用する場合、提供される機能として正しいものを2つ選択してください。
- A. 動画に登場する人物の顔を検出し、同一人物が複数シーンに登場するかを追跡する
- B. 動画のピクセル単位のセグメンテーションマップを出力する
- C. 動画内の音声を自動で文字起こし(Transcription)してテキスト化する
- D. 動画から静止画フレームを自動で切り出し3Dモデルを生成する
- E. 動画ファイルをリアルタイムストリームとして変換してAzure CDNで配信する
解答と解説を見る
正解: A, C
Azure Video IndexerはCの音声の自動文字起こし(Transcript)とAの顔の検出・同一人物トラッキングの両機能を提供する。Transcriptは動画内の発話を多言語でテキスト化し、顔トラッキングは複数シーンに渡って同一人物の登場箇所を特定する(顔識別のオプト利用が可能)。Bのピクセル単位のセグメンテーションマップ出力はVideo Indexerの機能に含まれない。Eのリアルタイムストリームへの変換とCDN配信はAzure Media ServicesやAzure CDNの機能であり、Video Indexerの用途は動画の分析・インサイト抽出である。Dの3Dモデル生成はVideo Indexerの機能には存在しない。