Cloud Monitoringとは
Google Cloud リソースとアプリケーションのメトリクスを収集・可視化・アラート通知するフルマネージドの監視サービス。VM・GKE・Cloud Run・Cloud SQL など主要サービスのメトリクスをエージェントなしで自動収集する。
カスタムメトリクスを OpenTelemetry または Monitoring API で送信でき、ダッシュボードで時系列グラフとして可視化できる。アラートポリシーで閾値超過時に PagerDuty・Slack・メールへ通知を送れる。
Cloud Monitoring は Cloud Logging・Cloud Trace・Cloud Profiler とセットで Google Cloud Observability スイートを構成し、統合されたオブザーバビリティ基盤として機能する。
試験での問われ方
ACE では アラートポリシーの設定(条件・通知チャネル・インシデント自動クローズ)と、稼働時間チェック(Uptime Check)によるエンドポイント死活監視の構成が問われやすい。
引っかけとして、VM のメモリ・ディスク使用率は デフォルトでは収集されず Ops Agent(旧 Monitoring Agent)のインストールが必要。GKE は Managed Service for Prometheus が標準統合されておりエージェント設定不要でクラスタメトリクスを取得できる。
このサービスが登場する演習問題(7問)
- 【CDL】ある企業が、Google CloudのCompute EngineとCloud Storageのパフォーマンスメトリクス…
- 【ACE】Cloud Monitoring で GCE インスタンスの CPU 使用率が 80% を超えた場合に通知を受け取りたい…
- 【ACE】Cloud Logging で特定のエラーパターンが検出されたときに自動的にインシデントチケットを作成したいと考えていま…
- 【ACE】Compute Engine インスタンスのカスタムメトリクスを Cloud Monitoring に送信したいと考えて…
- 【ACE】Cloud Monitoring で特定のプロジェクトの全リソースのメトリクスを単一のダッシュボードで確認したいと考えて…
- 【ACE】Cloud Monitoring で GKE クラスターの Pod 数とノード CPU 使用率を単一のダッシュボードで監…
- 【ACE】本番の Cloud Run サービスで週に 1〜2 回、ランダムに高レイテンシが発生しています。問題を再現する前に発生時…