Question

あるデータエンジニアが顧客離脱予測モデルを構築しようとしている。データセットには「顧客ID」「年齢」「契約期間」「月次利用料」「サポート問い合わせ回数」「離脱フラグ（0/1）」が含まれている。「顧客ID」を特徴量から除外すべき理由として最も適切なものはどれか。

Accepted Answer

顧客IDはサンプルを一意に識別する識別子であり、離脱という目的変数との統計的な相関を持たないため予測に役立たず、むしろ過学習の原因になりうる

Answer

顧客IDは必ず除外するというAzure Machine Learningの仕様がある

Answer

顧客IDは欠損値が多くデータ品質が低いため除外する必要がある

Answer

顧客IDは数値ではなくカテゴリ変数であるためモデルが処理できない

同じ分野の関連問題