控制器管理器 (COM)

指标列表

名称和说明 类型 抓取间隔 标签
up
一种二元指标,用于指示目标(通常是服务器或服务)是否正常运行。 仪表盘 5 米
  • pod_name:Pod 的名称。
  • 作业:作业的名称。
kube_pod_container_status_restarts_total
每个容器的容器重启次数。 计数器 5 米
  • container:容器的名称。
  • pod:Pod 的名称。
  • namespace:Pod 的命名空间。
  • uid:Pod 的唯一 ID。
kube_pod_container_status_waiting_reason
容器当前处于等待状态的原因。 仪表盘 5 米
  • container:容器的名称。
  • pod:Pod 的名称。
  • namespace:Pod 的命名空间。
  • 原因:容器处于等待状态的原因。
  • uid:Pod 的唯一 ID。
container_cpu_usage_seconds_total
所使用的累计 CPU 时间。 计数器 5 米
kube_pod_container_resource_requests
容器请求的资源数量。如果可能,请改用 kube-scheduler 公开的 kube_pod_resource_requests 指标,因为该指标更精确。 仪表盘 5 米
  • resource:资源的名称。
  • unit:资源单位。
  • container:容器的名称。
  • pod:Pod 的名称。
  • namespace:Pod 的命名空间。
  • node:节点的名称。
  • uid:Pod 的唯一 ID。
kube_pod_container_resource_limits
容器请求的资源限制数量。如果可能,请改用 kube-scheduler 公开的 kube_pod_resource_limits 指标,因为该指标更精确。 仪表盘 5 米
  • resource:资源的名称。
  • unit:资源单位。
  • container:容器的名称。
  • pod:Pod 的名称。
  • namespace:Pod 的命名空间。
  • node:节点的名称。
  • uid:Pod 的唯一 ID。
container_memory_working_set_bytes
当前工作集。 仪表盘 5 米
controller_runtime_reconcile_total
每个控制器的协调总数。 计数器 5 米
  • controller:控制器的名称。
  • 结果:对账的最终数量。
controller_runtime_webhook_requests_total
网络钩子服务器收到的请求总数。 计数器 5 米
  • webhook:网络钩子的名称。
  • succeeded:成功处理的请求数量。
controller_runtime_reconcile_time_seconds
每个控制器的协调时长(以秒为单位)。 直方图 5 米