ある金融サービス企業が電話による顧客本人確認プロセスを自動化したい。顧客が指定のパスフレーズを読み上げると、その声紋が登録済みのプロファイルと一致するかどうかを検証するシステムが必要である。Azure AI Speech のどの機能を使うべきか。
- A. テキスト読み上げ(Text to Speech):登録済み音声プロファイルを再生する
- B. 音声テキスト変換(Speech to Text):音声をテキストに変換して文字列照合する
- C. 話者認識(Speaker Recognition):音声から話者を識別・検証する
- D. 音声翻訳(Speech Translation):音声を別の言語に翻訳する
解答と解説を見る
正解: C
話者認識(Speaker Recognition)は音声から話者を識別(Speaker Identification)または検証(Speaker Verification)する機能である。Speaker Verification では登録済みの声紋プロファイルと入力音声を照合し、本人かどうかを判定できる。顧客本人確認の自動化に直接対応する。選択肢Bの音声テキスト変換はテキストを取得できるがパスフレーズの文字列照合だけでは声紋による本人確認にならず、なりすましを防止できない。選択肢Aのテキスト読み上げは音声生成であり、検証機能は持たない。選択肢Dの音声翻訳は別言語への変換であり、本人確認とは無関係である。