借助 Gemini Cloud Assist 进行依托 AI 技术的调查(预览版)

概览

Gemini Cloud Assist 调查预览版功能使用 Gemini 高级功能来帮助创建和运行 Managed Service for Apache Spark 集群及作业。此功能会分析失败的集群以及失败和运行缓慢的作业,以找出根本原因并建议修复方法。它会创建持久性分析,您可以查看、保存并与 Google Cloud 支持团队共享该分析,以便于进行协作并加快问题 解决速度。

特性

使用此功能可通过 Google Cloud 控制台创建调查:

  • 在创建调查之前,先为问题添加自然语言上下文说明。
  • 分析失败的集群以及运行缓慢和失败的作业。
  • 获取有关问题根本原因的分析洞见以及建议的修复方法。
  • 创建 Google Cloud 支持请求,并附上完整的调查上下文 。

准备工作

如需开始使用调查功能,请在您的 Google Cloud 项目中, 启用 Gemini Cloud Assist API

创建调查

如需创建调查,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往 Cloud Assist 调查 页面。

    Cloud Assist 调查

  2. 点击 创建

  3. 描述问题:提供集群或作业问题的说明。

  4. 选择时间范围:提供问题发生的时间范围(默认值 为 30 分钟)。

  5. 选择资源

    1. 点击 添加资源
      1. 快速过滤条件 字段中,输入“dataproc”,然后选择 dataproc.Batchdataproc.Jobdataproc.Cluster 中的一个或多个作为过滤条件。
      2. 选择列出的批次、作业或集群以进行调查。
  6. 点击创建

解读调查结果

调查完成后,系统会打开调查详情页面。此页面包含完整的 Gemini 分析,分为以下几个部分:

  • 问题:一个折叠部分,其中包含所调查的作业 的自动填充详细信息。
  • 相关观察内容:一个折叠部分,其中列出了 Gemini 在分析日志和指标期间发现的关键数据点 以及 Gemini 在分析日志 和指标期间发现的异常值。
  • 假设:这是主要部分,默认处于展开状态。 它会显示所观察问题的潜在根本原因列表。每个假设都包含:
    • 概览:对可能原因的说明,例如“Shuffle 写入时间过长,可能存在任务倾斜”。
    • 建议的修复方法:可用于解决 潜在问题的切实可行的步骤列表。

采取措施

查看假设和建议后:

  • 将建议的一个或多个修复方法应用于作业配置或代码,然后重新运行作业。

  • 如需针对调查的实用性提供反馈,请点击面板顶部的“我喜欢”或“不喜欢”图标。

查看和上报调查

如需查看之前运行的调查的结果,请点击 Cloud Assist 调查页面上的调查名称以打开调查详情页面。

如果您需要进一步的帮助,可以提交支持请求。 Google Cloud 此流程可为支持工程师提供之前执行的调查的完整上下文,包括 Gemini 生成的观察内容和假设。这种上下文共享可显著减少与支持团队之间所需的来回沟通,从而更快地解决支持请求。

如需基于调查创建支持请求,请执行以下操作:

调查详情 页面中,点击请求支持

预览状态和价格

在公开预览版期间,使用 Gemini Cloud Assist 调查无需付费。此功能推出正式版 (GA)后,将开始收费。

如需详细了解推出正式版后的价格,请参阅 Gemini Cloud Assist 价格

后续步骤