ACEクラウドソリューションの正常な運用の確保HARD単一選択

本番環境の GKE クラスターで特定の Pod が OOMKilled(メモリ不足でカーネルにより強制終了)されています。再発防止のために最初に設定すべきことはどれですか?

  1. A. Pod の Deployment に resources.limits.memory を適切な値に設定する
  2. B. Pod の Deployment に resources.requests.memory のみを設定する
  3. C. ノードのマシンタイプを大きくして総メモリ量を増やす
  4. D. GKE Autopilot に移行してメモリ管理を自動化する
解答と解説を見る

正解: A

OOMKilled はコンテナが設定した memory limit を超えたためカーネルに強制終了された状態です。resources.limits.memory を現在の実際のメモリ使用量に対して適切な余裕を持った値に設定(または修正)することで、予期しない OOM を防ぐか、または設定値を増やすことで正常に動作させられます。まず Cloud Monitoring でコンテナの実際のメモリ使用量を確認して適切な limit 値を判断します。ノードのマシンタイプ変更は根本原因の特定前に行う処置として適切ではありません。GKE Autopilot への移行は大きな変更で、まず limit の設定が先です。requests のみの設定では limit が設定されないため OOMKilled の防止になりません。

▸ この試験を本気で演習する(全150問・無料)