あるMLエンジニアが住宅価格予測モデルをトレーニングしたところ、トレーニングデータに対する精度は99%を超えていますが、テストデータに対する精度は62%まで低下しています。最小限の追加データ収集コストでこの問題を解決するために最も適切な最初のアプローチはどれですか。
- A. 推論エンドポイントのインスタンスタイプをアップグレードする
- B. トレーニングデータのみでモデルを再評価し、テストデータを増やす
- C. モデルを完全に再設計し、より複雑なニューラルネットワークを採用する
- D. ドロップアウトや正則化(L1/L2)などの過学習抑制手法を適用する
解答と解説を見る
正解: D
トレーニング精度が極端に高くテスト精度が著しく低い状態は過学習(Overfitting)の典型的な症状です。ドロップアウトや正則化(L1/L2 Regularization)はモデルの複雑さを制御し、汎化性能を高める代表的な手法であり、追加データなしで即座に適用できます。より複雑なモデルへの変更は過学習をさらに悪化させる可能性があり逆効果です。テストデータを増やすだけではモデル自体の汎化能力は改善されません。推論エンドポイントのインスタンスタイプはハードウェアリソースの問題であり、過学習とは無関係です。