您可以在运行状况和问题排查页面上查看服务和应用的运行状况。
- 查看根据您在 Cloud Monitoring 中设置的提醒政策触发的未解决的提醒。当满足提醒政策的条件时,Monitoring 会将未结提醒称为突发事件。
- 查看有效 Google Cloud 突发事件。这些突发事件是指 Google Cloud服务中断或降级。
- 查看有关 Google Cloud资源(例如利用率、延迟时间或错误)的健康状况和性能的指标。
您可以在 App Hub 应用中查看项目和受支持的基础设施的健康状况数据。
- 在项目视图中,您可以查看所选项目中有效 Google Cloud产品的健康数据。
- 在应用视图中,您可以查看所选应用中服务和工作负载的健康状况数据。
您还可以使用 Gemini Cloud Assist 调查来帮助您排查问题。
准备工作
如需查看 App Hub 应用的数据,请确保完成以下步骤:
为文件夹设置 App Hub 并创建应用。
为应用设置日志、指标和跟踪记录的汇总。
如需使用调查功能,请设置 Gemini Cloud Assist。
所需的角色
如需获得查看应用和资源健康状况数据所需的权限,请让管理员向您授予项目(项目视图)或文件夹的管理项目(应用视图)的以下 IAM 角色:
-
查看应用和项目数据:Cloud Hub Operator (
roles/cloudhub.operator) -
创建和查看调查:
Investigations Creator (
roles/geminicloudassist.investigationCreator)
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
如果您想根据分析结果进行更改,可能需要获得额外的权限,或者需要与组织中拥有所需权限的成员协调。例如,更改 GKE 集群的配置需要相应的 GKE 权限。
查看健康状况和问题排查信息
在 Google Cloud 控制台中,前往健康状况和问题排查页面,
选择要查看的项目或应用:
如需查看应用的数据,请选择已配置为应用管理的文件夹。配置为用于应用管理的文件夹具有特殊图标 (
)。相应文件夹的管理项目也具有特殊图标 (
),并且项目名称采用 FOLDER-NAME-mp格式。如果您选择的是管理项目而不是文件夹,项目选择器会自动将选择更改为文件夹。如需查看单个项目的数据,请选择您要查看的资源所在的项目。
在时间范围选择器中,选择要查看的时间范围。默认情况下,该页面会显示过去一小时的提醒、 Google Cloud 突发事件和健康数据。
该页面会显示所选时间范围内的以下信息:
- 未解决的提醒:显示所选项目中或与所选应用关联的提醒政策的未解决提醒总数。 如需在 Monitoring 中查看提醒,请点击查看提醒。 如需详细了解如何查看提醒(Monitoring 将其称为突发事件),请参阅基于指标的提醒政策的突发事件。
- Google Cloud 次突发事件:显示所选项目或应用的突发事件总数。 Google Cloud如需在 Personalized Service Health 中查看突发事件,请点击查看突发事件。 详细了解如何在 Service Health 中查看突发事件。
- Google Cloud 产品(项目视图):显示所选项目中每个有效Google Cloud 产品的未解决的提醒和 Service Health 状况事件(包括突发事件)。商品列表下方会显示图表,其中包含所选商品的关键健康数据。
- 服务和工作负载(应用视图):显示应用中每个活跃Google Cloud 服务或工作负载的未结提醒和 Service Health 事件(包括突发事件)。包含所选服务或工作负载的关键健康状况数据的图表会显示在服务和工作负载列表下方。
如需查看所列产品、服务或工作负载的详细信息,请点击列表中的相应名称。您可以使用以下选项来了解发生的事件或排查问题。
查看所选产品、服务或工作负载的图表。 每张图表都会显示所选时间段内的健康指标。
图表还会显示相关事件。事件类型有多种:
- Cloud Monitoring 提醒事件。
- Service Health 事件
- 特定于产品的活动
默认情况下,图表会显示推荐事件,但您可以使用页面顶部的注释选择器来选择要查看的事件。如需详细了解如何在图表上显示和隐藏事件,请参阅在信息中心内显示事件。
您可以像与其他监控图表互动一样与这些图表互动。 了解如何探索图表数据。
如需查看产品、服务或工作负载的未结提醒,请点击提醒列中的链接。
如需查看产品、服务或工作负载的 Google Cloud 相关突发事件,请点击Google Cloud 突发事件列中的链接。
如需在项目视图中查看产品的其他详细信息,请点击查看详情。每种产品都提供额外的可观测性数据、日志和其他信息,以帮助您诊断和排查问题。
如需在“监控”中打开应用工作负载或服务的详细信息,请点击查看信息中心。应用监控页面会显示工作负载或服务的信息中心。
使用 Gemini Cloud Assist 进行问题排查
Gemini Cloud Assist 调查是一款用于排查 Google Cloud基础架构和应用问题的根本原因分析 (RCA) 工具。调查可以帮助您更快地诊断和解决问题。
在 Cloud Hub 中,您可以查看最近的调查或开始新的调查。
如需创建或查看调查,请执行以下操作:
在 Google Cloud 控制台中,前往健康状况和问题排查页面,
选择要查看的项目或应用:
如需查看应用的数据,请选择已配置为应用管理的文件夹。配置为用于应用管理的文件夹具有特殊图标 (
)。相应文件夹的管理项目也具有特殊图标 (
),并且项目名称采用 FOLDER-NAME-mp格式。如果您选择的是管理项目而不是文件夹,项目选择器会自动将选择更改为文件夹。如需查看单个项目的数据,请选择您要查看的资源所在的项目。
最近的 Cloud Assist 调查部分会显示您创建或有权查看的近期调查。
后续步骤
- 详细了解 Monitoring 提醒。
- 详细了解服务运行状况和 Google Cloud突发事件。
- 了解监控信息中心。
- 了解 Gemini Cloud Assist 调查。