查看 Vertex AI Inference AI 自动指标

本文档介绍了如何使用 AI AutoMetrics 在 Vertex AI 上监控 AI 工作负载。

借助 AI AutoMetrics，您只需进行极少的配置即可监控模型的性能和运行状况。此功能旨在让您立即深入了解在 Vertex AI Inference 上运行的自定义容器和模型。

准备工作

如需在 Metrics Explorer 中查看 AI AutoMetrics，请执行以下操作：

您还可以使用 Grafana 或 Prometheus API 或界面查询指标。

AI AutoMetrics 支持以下框架：

框架	符合条件的端点	符合条件的指标
vLLM	Prometheus 兼容的 `/metrics` 端点	带有 `vllm:` 前缀的指标

Vertex AI 会以预定义的时间间隔自动抓取容器的 /metrics 端点。然后，所有符合条件的指标都会导出到Google Cloud Google Cloud Managed Service for Prometheus，您可以在其中分析和直观呈现这些指标。

AI AutoMetrics 收集的指标会根据 vertex_* 命名惯例注入到 Cloud Monitoring 中。

为了便于过滤和分组，AI AutoMetrics 会自动为各指标附加以下 Vertex AI 补充标签：