ある企業が、Google CloudのCloud Monitoringで設定したアラートが頻繁に誤報(偽陽性)を出しているため、アラートの精度を改善したいと考えています。アラートポリシーの改善策として最も適切なものはどれですか?
- A. Cloud Loggingにすべてのログを出力すれば自動的にアラートが最適化される
- B. アラートポリシーの閾値と評価期間(例:5分以上継続して閾値超過の場合のみ発報)を調整し、短時間のスパイクでは発報しないようにすることで誤報を削減する
- C. すべてのアラートを削除して監視を停止する
- D. アラートの通知先をメールからSMSに変更するだけで誤報は解消される
解答と解説を見る
正解: B
Cloud Monitoringのアラートポリシーでは、メトリクスが閾値を超えた瞬間に発報(過敏すぎる)のではなく、一定の評価期間(alignment period)と連続違反期間(duration)を設定することで「5分間継続してCPUが90%以上の場合のみアラート」のように一時的なスパイクを除外した精度の高いアラートを設定できる。閾値の見直しと評価期間の調整が誤報削減の最も直接的な対策。監視停止は可視性を完全に失う。通知チャネルの変更は誤報の原因ではない。Cloud Loggingのログ出力とアラート最適化は自動連動しない。