Question

ある企業が AWS 上でサーバーレスアプリケーションを構築しており、Lambda 関数が複数のダウンストリームサービス（外部 API、データベース、メッセージキュー）と連携します。ある Lambda 関数が外部 API の呼び出しに失敗した場合、他の Lambda 関数の呼び出しやデータベースへの書き込みが部分的に成功してしまい、データの整合性が失われる問題が発生しています。分散トランザクションの整合性を確保するには、どのアーキテクチャが最も適切ですか？

Accepted Answer

AWS Step Functions を使ってワークフローを定義し、各ステップの成功/失敗を State Machine で管理する。外部 API 呼び出しの失敗時はステートマシンが自動的にリトライロジックを実行し、最終的な失敗時には補償トランザクション（ロールバック用の Step）を実行してデータベースへの書き込みを取り消す（Saga パターン）

Answer

Lambda 関数のタイムアウトを延ばして外部 API の応答を長時間待機し、失敗した場合は Lambda を手動で再実行する

Answer

Amazon SQS の FIFO キューを使って全操作をシリアル化し、一つの操作が完了してから次の操作を実行する

Answer

すべての Lambda 関数を単一の大きな Lambda 関数に統合し、コード内でトランザクション管理を実装する

同じ分野の関連問題