ある企業が、音声コールセンターの通話録音データを活用してオペレーター研修に役立てたいと考えています。通話音声をテキストに変換し、顧客の感情を分析するために必要なGoogle Cloudサービスの組み合わせとして最も適切なものはどれですか?
- A. Cloud Speech-to-Text + Cloud Natural Language API
- B. Cloud Vision API + BigQuery
- C. Dataflow + Cloud Bigtable
- D. Vertex AI + Cloud Spanner
解答と解説を見る
正解: A
音声をテキストに変換するにはCloud Speech-to-Text API(音声認識)を使用し、変換されたテキストの感情分析(顧客の怒り・満足等の検知)にはCloud Natural Language APIの感情分析機能を使用する。この組み合わせが音声コールセンターデータ活用に最適。Cloud Vision APIは画像認識用で音声・テキスト分析とは無関係。DataflowとBigtableはETLとNoSQL DBであり感情分析機能はない。Vertex AIとSpannerは汎用ML基盤とトランザクションDBであり、既成APIとの組み合わせより効率が低い。