Question

ある企業が AWS 上で機械学習パイプラインを構築しており、毎日新しいトレーニングデータが S3 に追加されます。データエンジニアは特徴量エンジニアリングを Jupyter Notebook で実験し、本番パイプラインは毎日自動的にモデルを再トレーニングして Canary デプロイで本番 API に反映させたいと考えています。MLOps の最善のプラクティスに従った、最も包括的な AWS アーキテクチャはどれですか？

Accepted Answer

Amazon SageMaker Studio でデータ探索と実験を行い、SageMaker Pipelines で自動化された ML ワークフローを定義する。SageMaker Model Registry でモデルのバージョン管理と承認フローを管理し、SageMaker Endpoints でのデプロイに Blue/Green デプロイメント（カナリア重み付け）を使用する

Answer

AWS Glue で特徴量エンジニアリングを行い、EMR で ML トレーニングを実行する。ECS コンテナで推論 API をホストし、CodeDeploy でカナリアデプロイを実装する

Answer

Google Colab でノートブックを実行し、モデルを S3 にアップロードして Lambda で推論する

Answer

EC2 インスタンスで Jupyter Notebook を実行し、cron ジョブでトレーニングスクリプトを毎日実行する。モデルを S3 に保存し、Lambda 関数で推論を実行する

同じ分野の関連問題