Question

あるMLエンジニアが住宅価格予測モデルをトレーニングしたところ、トレーニングデータに対する精度は99%を超えていますが、テストデータに対する精度は62%まで低下しています。最小限の追加データ収集コストでこの問題を解決するために最も適切な最初のアプローチはどれですか。

Accepted Answer

ドロップアウトや正則化（L1/L2）などの過学習抑制手法を適用する

Answer

推論エンドポイントのインスタンスタイプをアップグレードする

Answer

トレーニングデータのみでモデルを再評価し、テストデータを増やす

Answer

モデルを完全に再設計し、より複雑なニューラルネットワークを採用する

同じ分野の関連問題