Question

あるスポーツデータ企業が、S3バケットに保存された試合動画ファイルを解析するパイプラインを構築している。S3にオブジェクトがアップロードされると自動で解析Lambdaが起動する構成だが、まれに同じファイルに対してLambdaが複数回起動されて重複処理が発生している。アーキテクチャの大きな変更なく冪等処理を保証する最も適切な方法はどれか。

Accepted Answer

S3イベントをEventBridge経由でSQSキュー（FIFO）に送信し、メッセージグループIDにS3オブジェクトキーを設定してFIFO重複排除を活用する。Lambdaの処理開始時にDynamoDB条件付きWriteでジョブIDを記録し（既存なら失敗→スキップ）、冪等処理を保証する

Answer

Lambdaの同時実行数を1に制限して逐次処理し、重複起動が起きないようにする

Answer

S3オブジェクトのETagをLambda内で毎回チェックし、前回処理時と異なる場合のみ処理を実行する

Answer

S3バケットのイベント通知をSNSトピックに変更し、SNSの重複排除IDを設定する

同じ分野の関連問題