ある機械学習プロジェクトで、データサイエンティストが学習データをモデルに与える際、各サンプルに対して正解ラベル(例:「スパム」「非スパム」)を付与して学習させている。このアプローチを表す機械学習の種類はどれか。
- A. 半教師あり学習:少量のラベルデータと大量のラベルなしデータを組み合わせる
- B. 教師なし学習:ラベルなしデータからパターンを発見する
- C. 強化学習:報酬シグナルをもとに行動ポリシーを最適化する
- D. 教師あり学習:ラベル付きデータを使ってモデルを訓練する
解答と解説を見る
正解: D
教師あり学習は、入力データ(特徴量)と正解ラベルのペアを使ってモデルを訓練するアプローチである。スパムフィルターのように「正解」が明確に与えられた状態で学習するのがこの枠組みの特徴。Bの教師なし学習は正解ラベルなしのデータからパターンを発見する手法で、ラベルを使う今回のケースとは異なる。Aの半教師あり学習は少量のラベルデータを活用する変形版であるが、設問は全サンプルにラベルが付与されている状況なので該当しない。Cの強化学習は報酬を通じて行動方策を最適化する枠組みであり、ラベル付きデータによる分類とは全く異なる。