本番の Cloud Run サービスで週に 1〜2 回、ランダムに高レイテンシが発生しています。問題を再現する前に発生時の詳細情報を収集したいと考えています。最も効果的なアプローチはどれですか?
- A. Cloud Monitoring のアップタイムチェックでレイテンシしきい値アラートを設定し、発生時に通知を受けてログを手動確認する
- B. 問題が発生するまで毎日ログを手動でスキャンする
- C. Cloud Trace のサンプリングレートを 100% に設定し、Cloud Monitoring でレイテンシ p99 アラートを設定して Pub/Sub 通知で自動的にスナップショットを取得する
- D. Cloud Run のリビジョンをすべて削除して再デプロイする
解答と解説を見る
正解: A
Cloud Monitoring のアップタイムチェックとカスタムアラートポリシーでレイテンシのしきい値(例: p99 > 5秒)を設定し、アラート発生時に通知を受け取ります。その後 Cloud Logging でその時間帯のエラーログ・リクエストログを確認し、Cloud Trace でリクエストのトレースを分析することで問題箇所を特定できます。この組み合わせが最も実践的で費用対効果が高いです。サンプリングレート 100% は本番トレースのコストが高くなりすぎるため非現実的です。毎日の手動スキャンはランダム発生のバグに対して非効率です。再デプロイは問題の根本原因を特定せずに行う行為で、再発の可能性があります。
📚 関連サービスの解説: Cloud Monitoring