Question

ある企業が AWS CodePipeline と CodeBuild を使ったデプロイパイプラインを運用していますが、本番デプロイ後に障害が発生した場合の復旧時間（MTTR）が長いという問題があります。現在のデプロイはすべてのインスタンスを同時に更新するローリングデプロイで、問題が検出された時点では既に全インスタンスが更新されています。デプロイリスクを軽減し、問題発生時の即時ロールバックを実現するためのアーキテクチャ改善はどれですか？

Accepted Answer

AWS CodeDeploy を使って Blue/Green デプロイメントに切り替える。新バージョン（Green 環境）を ALB の別ターゲットグループにデプロイし、CloudWatch Alarm でエラー率や P99 レイテンシーを監視して、アラームが発火した場合は自動的に Blue 環境（旧バージョン）に即時ロールバックする

Answer

デプロイ前に必ずステージング環境でテストを実施し、テスト合格後のみ本番デプロイを許可するゲートを CodePipeline に追加する

Answer

AWS Elastic Beanstalk に移行し、Beanstalk の組み込みデプロイ戦略（Rolling with additional batch）を使用する

Answer

AMI ゴールデンイメージを毎リリースで作成し、Auto Scaling グループの起動テンプレートを更新して新しい AMI に切り替える

同じ分野の関連問題