Question

ある企業が、大規模な e コマースサイトのトップページに表示する商品リコメンデーションを、Amazon Personalize を使ってリアルタイムで生成している。推論レイテンシーが 500ms を超えており、ユーザー体験を改善するために 100ms 以下に短縮したい。コスト効率を維持しながら実現する最も適切なソリューションはどれか。

Accepted Answer

ユーザーごとのリコメンデーション結果を Amazon ElastiCache for Redis にキャッシュし、TTL（例: 5 分）を設定する。キャッシュがある場合は Personalize を呼び出さずにキャッシュから返す。

Answer

Amazon Personalize の推論エンドポイントをより大きいインスタンスタイプにアップグレードする。

Answer

AWS Lambda を Personalize と統合して非同期に推論を実行し、結果が準備できたらユーザーに送信する。

Answer

Amazon CloudFront で Personalize の推論結果をキャッシュする。

同じ分野の関連問題