Question

ある企業が、マイクロサービスアーキテクチャを採用して複数の API を Amazon API Gateway と AWS Lambda で運用している。各サービスは互いを直接同期的に呼び出すことがあり、依存先サービスの障害が連鎖してシステム全体がダウンするカスケード障害が発生した。カスケード障害を防ぎ、弾力性を向上させる設計を 2 つ選択してください。

Accepted Answer

サービス間の同期呼び出しの代わりに Amazon SQS キューまたは Amazon SNS を経由した非同期メッセージングに切り替え、依存サービスの障害が呼び出し元に伝播しないようにする。

Accepted Answer

API Gateway の統合タイムアウトとサーキットブレーカーパターンを実装する。依存サービスへの呼び出しが一定回数失敗した場合は即座にフォールバックレスポンスを返し、回路を「Open」状態にして一定時間後に再試行する。

Answer

Lambda 関数のタイムアウト値を最大値（15 分）に設定して依存サービスの応答を長時間待機できるようにする。

Answer

全サービスを単一の Lambda 関数に統合して依存関係をなくす。

Answer

Amazon CloudWatch でサービスごとのエラー率を監視し、エラー率が高いサービスのLambda 関数のメモリを増やして処理能力を向上させる。

同じ分野の関連問題