あるデータサイエンティストが機械学習モデルを評価するためにさまざまな指標を検討している。分類モデルの評価に使用できる指標を2つ選択してください。
- A. MAE(平均絶対誤差):予測値と実測値の絶対差の平均を計算する
- B. RMSE(二乗平均平方根誤差):回帰タスクで連続値の予測誤差を評価する
- C. 適合率(Precision):陽性と予測したサンプルのうち実際に陽性だった割合
- D. 再現率(Recall):実際の陽性サンプルのうちモデルが正しく陽性と予測できた割合
- E. R²(決定係数):モデルが目的変数の分散をどれだけ説明できるかを示す
解答と解説を見る
正解: C, D
適合率(Precision)と再現率(Recall)はどちらも分類モデルの評価指標である。適合率はモデルが「陽性」と予測したうち実際に正解だった割合(誤検知の少なさ)、再現率は実際の陽性を見逃さずに検出できた割合(見逃しの少なさ)を表す。BのRMSEとAのMAEは回帰タスク(連続値予測)の評価指標であり、分類モデルには使わない。EのR²も回帰タスクの評価指標(分散説明率)であり、カテゴリ予測の評価には不適切。分類タスクには精度・適合率・再現率・F1スコア・AUC-ROCなどが使われる。