使用 Prometheus 警報監控 Spanner Omni

本文說明適用於 Spanner Omni 的 Prometheus 快訊。您可以透過這些快訊監控 Spanner Omni 部署作業的狀態和成效。

TrueTime 警示

請使用下列快訊監控部署作業中的 TrueTime 狀態:

快訊 嚴重性 時間長度 說明
TrueTimeUnavailable 重大嚴重性 1 分鐘 TrueTime 服務中斷超過 1 分鐘。
ClockSlaViolation 重大嚴重性 1 分鐘 伺服器違反時鐘服務水準協議 (SLA)。

CPU 快訊

請使用下列快訊監控部署作業的 CPU 使用率:

快訊 嚴重性 時間長度 說明
SpannerHighCPUUtilization 警告 5 分鐘 整體 CPU 使用率已超過 65% 達 5 分鐘以上。

儲存空間快訊

請使用下列快訊監控部署作業的儲存空間用量:

快訊 嚴重性 時間長度 說明
SpannerStorageUtilizationWarning 警告 5 分鐘 伺服器上的 Spanner Omni 儲存空間用量很高 (80%)。
SpannerStorageUtilizationCritical 重大嚴重性 5 分鐘 伺服器上的 Spanner Omni 儲存空間用量偏高 (90%)。
SpannerStoragePerVCPUTooHigh 警告 5 分鐘 每個 vCPU 的儲存空間超過 500 GB。

後續步驟