Question

ある企業が、機械学習モデルの学習に大量のデータセット（合計 500TB）をストレージから読み込む処理を AWS で実行したい。ストレージとコンピューティングが密結合してスループットが不足している。高スループット・低レイテンシーで大規模なデータセットへのアクセスが必要で、複数の EC2 インスタンスから同時アクセスしたい。最も適切なストレージサービスはどれか。

Accepted Answer

Amazon FSx for Lustre を使用し、S3 のデータを Lustre ファイルシステムにリンクする。複数の EC2 インスタンスから高スループット（数百 GB/s）での並列アクセスが可能。

Answer

Amazon EBS（io2 Block Express）ボリュームを各 EC2 インスタンスにアタッチして高 IOPS を確保する。

Answer

Amazon EFS（Elastic File System）をマウントして複数 EC2 インスタンスからの共有アクセスを実現する。

Answer

Amazon S3 に全データを保存し、EC2 インスタンスから直接 S3 API でアクセスする。

同じ分野の関連問題