使用 Gemini 设计计算基础架构

本文档介绍了如何通过提示 Gemini 来规划和设计计算基础设施。

您可以在 Google Cloud 控制台中使用 Gemini 作为 AI 赋能的界面,评估硬件选项、估算部署费用,以及查看 Compute Engine 实例的推荐配置。 为了量身定制建议,Gemini 会通过检查您的配额限制、现有预留、承诺使用折扣 (CUD)默认区域和可用区以及任何资源位置限制条件来评估您的 Google Cloud项目。借助 Gemini 帮助您进行规划,您可以在创建或修改计算实例之前,为工作负载找到最佳配置。

如需详细了解在创建计算实例之前或创建时必须配置的组件,请参阅创建 Compute Engine 实例概览

限制

在 Google Cloud 控制台中向 Gemini 发出提示时,您无法使用 Gemini 创建、修改或删除资源。

准备工作

当您使用 Google Cloud 控制台访问 Google Cloud 服务和 API 时,无需设置身份验证。

所需的角色

如需获得访问 Gemini 并向其发出提示所需的权限,请让管理员向您授予项目的 Compute Viewer (roles/compute.viewer) IAM 角色。 如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

此预定义角色包含访问 Gemini 并向其发出提示所需的权限。如需查看所需的确切权限,请展开所需权限部分:

所需权限

如需访问 Gemini 并向其提问,您需要具备以下权限:

  • 查看实例列表: compute.instances.list

您也可以使用自定义角色或其他预定义角色来获取这些权限。

在 Google Cloud 控制台中访问 Gemini

如需在 Google Cloud 控制台中访问 Gemini,请完成以下步骤:

  1. 在 Google Cloud 控制台中,前往概览页面。

    转到“概览”页面

  2. 使用 Compute Advisor 设计基础架构部分中,您可以查看以下内容:

    Compute Advisor 页面的屏幕截图以及构成该页面的界面元素。

    上图所示的界面元素如下:

    • 快速操作提示卡片:一组卡片,每张卡片都包含一个提示示例。如果您点击某个卡片, Google Cloud 控制台会自动在提示框中填充示例提示。

    • 提示框:您可以在此字段中输入和提交提示。如需提交提示,请点击提交提示

    • 查看之前的对话:借助此功能,您可以查看过往对话的详细信息并继续对话,也可以删除不再需要的对话。

向 Gemini 发出提示

提交提示后,Gemini 会开始生成回答。系统会显示一个窗格, Google Cloud 控制台会在该窗格中显示对提示的回答,如以下屏幕截图所示:

提交提示后的 Compute Advisor 页面屏幕截图。

根据您的提示,回答窗格包含以下元素:

  • 情境化依据:Gemini 会自动评估项目情境,以提供高度量身定制的建议,包括配额限制、现有预留、CUD、默认区域和可用区,以及任何资源位置限制。

  • 交互式代码段:Gemini 会生成 gcloud 命令、REST API 方法或 Terraform 资源。您可以复制并粘贴这些代码段,也可以在 Cloud Shell 中运行它们。

  • 可视化画布:Gemini 会将建议整理成结构化表格和并排比较。此视图有助于您评估产品功能和架构方法。它还可为您的使用场景提供实现方案。

以下部分概述了编写提示的最佳实践,以及在创建或修改计算实例之前可以使用的示例提示。

提示方面的最佳实践

为了让 Gemini 提供最准确且可据以采取行动的建议,我们建议您以与代码块相同的方式构建提示。这种方法通过使用清晰的形参声明、角色定义、具体说明和明确的输出格式来引导生成式 AI。

在向 Gemini 发出提示时,请考虑以下最佳实践:

  • 专注于设计和规划:我们建议您不要提示 Gemini 对计算实例错误进行问题排查。如需解决这些错误,请改为参阅排查创建、更新和删除计算实例时的问题

  • 指定角色设定或角色:声明 Gemini 要扮演的目标角色或角色设定,例如 IT 管理员、AI 研究员或平台工程师。此方法可指导生成建议的语气、深度和专业程度。

  • 提供明确的编号指令:将目标分解为具体的、分步的问题或任务。这种方法可构建 Gemini 的推理过程,并有助于确保 Gemini 满足您的所有要求。

  • 定义特定的输出格式:明确说明您希望建议采用哪种格式,例如分步说明、Markdown 比较表格或可直接使用的 gcloud 代码块。

  • 利用自动上下文接地:您无需在提示中包含默认区域或可用区、可用配额、CUD 或资源位置限制。Gemini 可以访问您 Google Cloud 项目中的这些信息。

  • 迭代式优化设计:您可以发送新提示来修改或扩展 Gemini 生成的回答。例如,您可以要求助理在部署方案中添加网络建议,或修改存储空间要求,而无需开始新的对话。

示例提示

以下是一些提示示例,可帮助您设计和优化计算基础架构:

  • 计算实例拓扑和展示位置策略:如需确定高可用性工作负载的最佳部署模型和展示位置政策,请使用如下提示:

    Act as a cloud architect. I need to design a compute instance topology for a
    distributed database that balances multi-zone resilience with
    sub-millisecond latency.
    
    Please provide the following:
    1. A side-by-side comparison of regional MIGs against zonal MIGs.
    2. An explanation of whether compact placement policies work regionally.
    3. The optimal autoscaling configuration for this workload.
    
    Format the comparison as a Markdown table, and provide the deployment steps
    as ready-to-use gcloud code blocks.
    
  • 配置模型和费用优化:如需评估配置模型并降低批处理费用,请使用如下提示:

    Act as a platform engineer. I need to find the cheapest way to run large,
    interruptible analytics jobs on our cloud servers without risking data loss.
    
    Please provide the following:
    1. A cost and reliability comparison of standard discounted servers against
       queue-based servers.
    2. An explanation of how to boot all our compute power at the exact same
       time.
    3. A deployment script that gives our jobs a two-minute warning before a
       server gets reclaimed.
    
    Format the comparison as a Markdown table, and provide the script as a
    ready-to-use code block.
    

后续步骤