あるMLエンジニアが、Amazon SageMaker でトレーニングジョブを最もコスト効率よく実行する方法を検討しています。トレーニングは1〜2時間で完了し、処理が中断されても再開できる設計になっています。最もコストを削減できる SageMaker の機能はどれですか。
- A. Multi-Model Endpoint を使い、複数モデルを単一エンドポイントで共有する
- B. オンデマンドインスタンスを使い、トレーニング完了まで継続して実行する
- C. SageMaker Studio の自動シャットダウン機能を有効化してコストを削減する
- D. マネージドスポットトレーニング(Managed Spot Training)を使用し、スポットインスタンスを活用する
解答と解説を見る
正解: D
SageMaker のマネージドスポットトレーニングはAWS スポットインスタンスを活用し、オンデマンド料金に比べて最大90%のコスト削減が可能です。チェックポイントを設定しておけば中断時に途中から再開でき、本ケースの「中断後再開できる設計」という前提と完全に一致します。オンデマンドインスタンスは可用性は高いですが、コスト削減効果はスポットと比較して大幅に低くなります。Studio の自動シャットダウンは Studio アプリのアイドルコストを削減しますが、トレーニングジョブのコストとは直接関係しません。Multi-Model Endpoint は推論の効率化に使うもので、トレーニングコストの削減手段ではありません。