あるナビゲーションアプリが車内でユーザーに音声でルート案内を行いたい。目的地・経由地・到着予想時刻などのテキスト情報を自然な日本語音声として出力する必要がある。最適な Azure AI Speech の機能はどれか。
- A. 音声テキスト変換(Speech to Text):音声をテキストに書き起こす
- B. 話者認識(Speaker Recognition):音声から話者を識別する
- C. テキスト読み上げ(Text to Speech):テキストを自然な音声に合成して出力する
- D. 音声翻訳(Speech Translation):音声を別の言語に翻訳する
解答と解説を見る
正解: C
テキスト読み上げ(Text to Speech)はテキストを音声に合成する機能であり、ルート案内文を自然な音声で出力するユースケースに最適である。Azure AI Speech は Neural TTS を提供しており、自然で聞き取りやすい音声を生成できる。選択肢Aの音声テキスト変換は逆方向(音声→テキスト)の機能であり、音声出力の生成には使えない。選択肢Bの話者認識は誰が話しているかを識別する機能であり、音声生成は行わない。選択肢Dの音声翻訳は翻訳機能であり、日本語から日本語の音声出力には不要な機能である。