Question

ある企業が大規模な深層学習モデルのトレーニングを Amazon SageMaker で実施しようとしています。単一のGPUインスタンスではメモリが不足するほど大きなモデルを効率的にトレーニングするための正しいアプローチを2つ選択してください。

Accepted Answer

SageMaker の分散トレーニング（モデル並列化）を使用し、モデルのレイヤーを複数の GPU に分割する

Accepted Answer

SageMaker の分散トレーニング（データ並列化）を使用し、異なるデータのサブセットを複数の GPU で同時に処理する

Answer

トレーニングデータをすべてメモリに事前ロードして処理速度を上げる

Answer

バッチサイズを最大限に増やすことで GPU の稼働率を上げる

Answer

単一 GPU の VRAM を超えるモデルは必ず小さくリアーキテクチャしてから使用する

同じ分野の関連問題