ある企業のMLエンジニアが Amazon SageMaker を使用してモデルをトレーニングしています。トレーニングジョブが完了しましたが、検証データのロス(損失)が一定値で収束せず、エポックが進むにつれて上昇し続けています。この状態の原因として最も適切な説明はどれですか。
- A. データの正規化が不十分で、各特徴量のスケールが揃っていない
- B. バッチサイズが大きすぎて、勾配の更新が不安定になっている
- C. 学習率(Learning Rate)が低すぎて、モデルが局所最適解に陥っている
- D. モデルが過学習しており、訓練データに特化しすぎて汎化性能が低下している
解答と解説を見る
正解: D
検証ロスがエポック進行とともに上昇し続ける現象は過学習(Overfitting)の典型的なシグナルです。モデルが訓練データのノイズやパターンを記憶してしまい、未見データ(検証データ)への汎化性能が低下しています。学習率が低すぎる場合は訓練・検証ロスともにゆっくりとしか下がらず収束が遅いですが、検証ロスが単調増加する現象とは異なります。バッチサイズの影響は勾配の分散に現れますが、検証ロスが継続的に上昇する直接的な原因ではありません。データの正規化不足はトレーニング初期の収束を遅らせますが、検証ロスが訓練後半に上昇し続ける現象を説明しません。