使用 Prometheus 提醒监控 Spanner Omni

本文档介绍了适用于 Spanner Omni 的 Prometheus 提醒。您可以使用这些提醒来监控 Spanner Omni 部署的状态和性能。

TrueTime 提醒

您可以使用以下提醒来监控部署中 TrueTime 的状态:

提醒 严重程度 时长 说明
TrueTimeUnavailable 严重 1 分钟 TrueTime 不可用超过 1 分钟。
ClockSlaViolation 严重 1 分钟 服务器违反了时钟服务等级协议 (SLA)。

CPU 提醒

您可以使用以下提醒来监控部署的 CPU 利用率:

提醒 严重程度 时长 说明
SpannerHighCPUUtilization 警告 5 分钟 总体 CPU 利用率已超过 65% 超过 5 分钟。

存储空间提醒

您可以使用以下提醒来监控部署的存储空间利用率:

提醒 严重程度 时长 说明
SpannerStorageUtilizationWarning 警告 5 分钟 服务器上的 Spanner Omni 存储空间利用率较高 (80%)。
SpannerStorageUtilizationCritical 严重 5 分钟 服务器上的 Spanner Omni 存储空间利用率较高 (90%)。
SpannerStoragePerVCPUTooHigh 警告 5 分钟 每个 vCPU 的存储空间超过 500 GB。

后续步骤