AI-900機械学習の基本原則MEDIUM複数選択

ある企業のデータチームが機械学習プロジェクトを開始する際に、問題設定の段階で判断すべき事項がある。機械学習の「教師あり学習」に分類されるタスクを2つ選択してください。

  1. A. メール本文から「スパム」か「正常」かを分類する
  2. B. 購買履歴データから、似た購買パターンの顧客グループを自動的に発見する
  3. C. 住宅の広さ・築年数・駅距離のデータから住宅価格(円)を予測する
  4. D. 画像データを主成分分析で2次元に圧縮して可視化する
  5. E. センサーデータの正常パターンだけを学習し、外れた挙動を異常として検出する(教師なし)
解答と解説を見る

正解: A, C

教師あり学習とは、入力特徴量と正解ラベル(数値またはカテゴリ)のペアを使ってモデルを訓練する枠組みである。Cの住宅価格予測は正解ラベルが「価格(数値)」の回帰タスクで教師あり学習に該当する。Aのスパム分類は「スパム/正常」というラベルを使う分類タスクで同じく教師あり学習。Bのクラスタリングはラベルなしデータからグループを発見する教師なし学習。Eの異常検知(正常パターンのみ学習)は「教師なし」と明記されており、正解ラベルを必要としない。Dの次元削減(PCA)も教師なし学習の一手法であり、正解ラベルを使わない。

▸ この試験を本気で演習する(全150問・無料)