あるMLチームがAzure Machine Learningでモデルを訓練するためのコンピューティングリソースを選択しようとしている。コストを抑えながら大規模な並列学習を行うために適切なコンピューティングを2つ選択してください。
- A. ローカルコンピューティング:開発者のPCをそのままAzure MLの計算先として使う
- B. コンピューティングインスタンス:常時稼働の開発用仮想マシンで、停止しない限り課金が継続する
- C. スポット(低優先度)VMを使ったコンピューティングクラスター:割引価格でVMを使用でき、大規模並列訓練に適している
- D. コンピューティングクラスター(最小ノード数0設定):アイドル時はゼロにスケールし、ジョブ時のみ課金される
- E. Azureリザーブドインスタンスで固定した単一GPU VM:常時1台のGPUで訓練する
解答と解説を見る
正解: C, D
コスト削減と大規模並列学習を両立するには、DとCの組み合わせが最適である。Dのコンピューティングクラスター(最小ノード0設定)はアイドル時にゼロスケールして課金を止められる。Cのスポット(低優先度)VMは市場価格より大幅に安い割引レートでVMを確保でき、中断許容できるバッチ学習ジョブに非常に有効。Bのコンピューティングインスタンスは常時稼働で停止しない限り課金が続くため、コスト最小化には不向き。Aのローカルコンピューティングはスケールアウトができず大規模並列学習には対応できない。Eのリザーブドインスタンスはコストコミットメントがあり常時1台のみで大規模並列学習に向かない。