あるスタートアップが、ユーザーのレビュー文(数百字)を1〜5の感情スコアに分類するタスクを実装しようとしている。トレーニングデータは1万件のラベル付きレビューが手元にある。コストと精度のバランスを重視する場合、最も適切な選択はどれか。
- A. Amazon Rekognition の画像分析機能を利用してテキスト感情を判定する
- B. ルールベースのキーワードマッチングのみで分類し、ML を一切使わない
- C. 小規模な BERT 系分類モデルをファインチューニングして専用分類器を構築する
- D. GPT-4 相当の大規模 LLM を API 経由で呼び出し、1リクエストごとに感情スコアを生成させる
解答と解説を見る
正解: C
感情分類のような構造化予測タスクは、1万件のラベルデータがあれば BERT 系モデルのファインチューニングで十分な精度が得られ、推論コストも大規模 LLM より大幅に安い。これは「生成 AI と従来 ML の使い分け」の典型例である。Dは誤り:大規模 LLM は汎用性は高いが推論コストが高く、ラベルデータが存在するタスクには過剰投資になりやすい。Aは誤り:Rekognition は画像・動画の分析サービスであり、テキスト感情分類には使えない。Bは誤り:ルールベースはメンテナンスコストが高く、表現の多様性に対応できず精度も低い。