通过客户支持团队预留容量

本文档介绍了当您想要使用 AI Hypercomputer 使用选项中的未来预留时,如何获取容量。 如需了解 AI Hypercomputer 中的所有容量选项,请参阅 容量概览

如需确保工作负载拥有所需的资源,请向 Google 请求未来 预留。此操作可让您预留容量块,预留时长由您定义, 从您选择的特定日期和时间开始。Google 会根据您的请求创建 未来预留请求草稿。在您审核并提交此请求草稿后,如果 Google Cloud 批准了该请求,Compute Engine 会自动创建 (自动创建) 一个空预留。 接着,Compute Engine 会在您选择的开始时间将您请求的容量预配到 自动创建的预留中。然后,您可以使用该预留创建 Compute Engine 实例 ,直至预留期结束。

限制

本部分介绍了针对未来预留请求以及针对请求自动创建的 预留的限制。

针对未来预留请求的限制

在 Google 为您创建未来预留请求草稿后,需要遵循以下限制 :

  • 您无法修改请求详细信息,包括共享类型。
  • 提交请求并获得批准后,如果请求状态变为 PROVISIONING, ,您将无法取消或删除该请求。无论使用情况如何,您都必须承诺从请求 开始时间起支付所请求容量的费用。

针对自动创建的预留的限制

在 Compute Engine 创建按需预留以满足您请求的容量后, 需要遵循以下限制:

  • 您只能在请求开始时间之后使用或修改预留。
  • 您只能按如下方式修改预留:

    如需修改预留中的其他属性,您必须与您的客户支持团队联系。

  • 您无法手动删除预留。如果您在预留容量时指定不希望在预留期结束时自动删除预留,则必须与您的客户支持团队联系以删除预留。

准备工作

所需的角色

如需获得创建未来预留请求所需的权限,请让您的管理员为您授予项目的 Compute Future Reservation User (roles/compute.futureReservationUser) IAM 角色。 如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

此预定义角色包含 创建未来预留请求所需的权限。如需查看所需的确切权限,请展开所需权限部分:

所需权限

创建未来预留请求需要具备以下权限:

  • 允许 Compute Engine 自动创建预留: compute.reservations.create 针对项目的
  • 创建未来预留请求:针对项目的 compute.futureReservations.create 权限
  • 如需指定实例模板:实例模板的 compute.instanceTemplates.useReadOnly 权限

您也可以使用自定义角色或其他预定义角色来获取这些权限。

Quota

在未来预留请求过程中,Google 会管理预留 资源的配额。您无需申请配额。在已获批准的未来预留的开始时间, 如果您的项目没有足够的预留 资源配额,Google 会自动增加配额。

概览

如需预留容量块,请完成以下步骤:

  1. 通过客户支持团队请求容量 。与您的客户支持团队联系,指定您要预留的资源类型 和数量。
  2. 审核并提交预留请求草稿 。在 Google 创建未来 预留请求草稿后,请对其进行审核。如果看起来正确无误,请提交请求以供审核。 Google Cloud 会立即批准该请求。

通过客户支持团队请求容量

与您的客户支持团队联系,并提供以下信息,以便 Google 创建未来预留请求草稿:

  • 项目编号:您的客户支持团队创建请求且 Compute Engine 预配容量的项目的编号。
  • 机器类型:要预留的机器类型。您可以指定以下类型之一:
    • A4X Max (a4x-maxgpu-4g-metal)
    • A4X (a4x-highgpu-4g)
    • A4 (a4-highgpu-8g)
    • A3 Ultra (a3-ultragpu-8g)
    • A3 Mega (a3-megagpu-8g)
    • A3 High (a3-highgpu-8g)
  • 可用区:您要在其中预留容量的可用区。 如需查看 GPU 机器类型的可用区域和可用区,请参阅 加速器可用性
  • 总数:要预留的计算实例总数。您只能预留 计算实例的倍数。每个块的块大小和计算实例数量因机器类型和可用性而异。您的客户支持团队可以提供有关您的请求的更多详细信息。
  • 开始时间:预留期的开始时间。您可以从该时间开始使用预留的 容量。将开始时间的格式设置为 RFC 3339 时间戳,如下所示:
    YYYY-MM-DDTHH:MM:SSOFFSET
    

    替换以下内容:

    • YYYY-MM-DD:日期格式为四位数年份、两位数月份、 两位数日期,以连字符 (-) 分隔。
    • HH:MM:SS:时间格式为两位数小时(使用 24 小时 制)、两位数分钟和两位数秒,以英文冒号 (:) 分隔。
    • OFFSET:采用 世界协调时间 (UTC) 的偏移量格式的时区。例如,如需使用太平洋标准时间 (PST),请指定 -08:00。如需 不使用偏移量,请指定 Z
  • 结束时间:预留期的结束时间。将其格式设置为 RFC 3339 时间戳。届时,Compute Engine 会执行以下操作:
    • Compute Engine 会删除自动创建的预留。
    • 根据您为 终止操作指定的 计算实例 ,Compute Engine 会停止或删除您使用自动创建的预留创建的任何 计算实例 。
  • 预留名称:Compute Engine 创建的用于 交付预留容量的预留名称。Compute Engine 只能创建 明确定向预留
  • 预留自动删除:您是否希望 Compute Engine 在预留期结束时自动 删除自动创建的预留。如果您想手动 删除预留,则必须与您的客户支持团队联系以删除预留。
  • 维护安排类型:Compute Engine 如何为集群中的计算实例安排主机维护。指定 以下选项之一:
    • 如需在预留块中的所有 A4X Max、A4X、A4 或 A3 Ultra 实例之间同步维护,请使用 GROUPED
    • 如需为 A4 或 A3 Ultra 实例使用不同的维护时间表,请使用 INDEPENDENT
  • 预留运行模式:在主机错误或故障主机报告后,您或 Google Cloud 是否管理计算实例恢复流程。您使用的模式取决于您预留的机器类型:
    • 所有容量模式 (ALL_CAPACITY)。此模式仅适用于 A4X Max 和 A4X 机器 类型。您必须手动管理计算实例的维护和恢复流程。不过,您可以完全访问预留中的所有机器,并对计算实例拓扑和维护进行更精细的控制。
    • 受管理模式 (HIGHLY_AVAILABLE_CAPACITY)。此模式仅适用于 A4、A3 Ultra、 A3 Mega 和 A3 High 机器类型。您可以通过自动替换故障机器,让 Google Cloud 管理计算实例的维护和 恢复流程。这种方法可以提高计算实例的可用性,并帮助您在新的主机上快速重启这些实例。不过,在 Compute Engine 替换机器后,计算实例的拓扑可能会发生变化。
  • 共享类型:只有您的项目可以使用自动创建的 预留 (LOCAL),还是其他项目也可以使用该预留 (SPECIFIC_PROJECTS)。提交 请求后,此属性无法更改。如需与组织中的其他项目共享预留的容量,请执行以下操作:
    1. 验证 Google 在其中创建请求的项目是否可以创建共享预留(如果您尚未这样做)。
    2. 提供要与其共享预留容量的项目的编号。您最多可以指定组织中的 100 个项目。
  • 承诺名称:如果预留期为一年或更长时间,则您必须购买并附加基于资源的承诺到预留的资源。对于 1 年到 3 年以下的预留期,承诺 可让您享受 1 年期承诺使用折扣 (CUD) 费率。对于 3 年到 6 年以下的预留期,承诺可让您享受 3 年期 CUD 费率。

    如果您与其他项目共享预留容量,则这些项目只有 在使用与预留容量的项目相同的 Cloud Billing 帐号时才会获得折扣。如需了解详情,请参阅为基于资源的承诺启用 CUD 共享

    承诺的开始日期和结束日期与预留相同,但激活时间 可能不同。如果您将预留开始时间指定为美国和加拿大太平洋时间凌晨零点, 则承诺会在您选择的开始日期当天凌晨零点生效。如果您指定了其他开始时间,则承诺会在所选开始日期次日的凌晨零点生效。

在 Google 创建未来预留请求草稿后,您的客户支持团队会与您联系。

审核并提交预留请求 草稿

在您向客户支持团队提供要预留的资源类型和数量后,Google 会创建未来预留请求草稿。您可以审核请求草稿,如果正确无误,则 提交以供审核。您必须在请求开始时间之前提交请求。

如需审核并提交未来预留请求草稿,请选择以下选项之一:

控制台

  1. 在 Google Cloud 控制台中,前往预留页面。

    前往“预留”

  2. 点击未来预留 标签页。未来预留 表会列出项目中的每个未来 预留请求,表中的每一列描述一个属性。
  3. 名称 列中,点击 Google 为您创建的请求草稿的名称。系统会打开一个显示相应未来预留请求详细信息的页面。A
  4. 基本信息 部分中,验证请求详细信息(例如日期共享类型 )是否正确。此外,如果您请求了承诺,请验证是否已 指定承诺。如果上述任何详细信息不正确,请与您的客户支持团队联系。
  5. 如果一切看起来都准确无误,请提交请求:

    1. 点击 修改草稿。系统会显示一个用于修改请求草稿 的页面。
    2. 点击创建 。系统会显示预留 页面。 Google Cloud 会在几分钟内批准您的 请求,然后 Compute Engine 会创建一个包含您请求的资源的空预留 。

gcloud

  1. 如需查看项目中的未来预留请求列表,请使用 gcloud compute future-reservations list 命令 ,并将 --filter 标志设置为 PROCUREMENT_STATUS=DRAFTING
    gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
    
  2. 在命令输出中,查找您向 客户支持团队提供的名称对应的预留请求。
  3. 如需查看请求草稿的详细信息,请使用 gcloud compute future-reservations describe 命令
    gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \
        --zone=ZONE
    

    替换以下内容:

    • FUTURE_RESERVATION_NAME:未来预留请求草稿的名称 。
    • ZONE:Google 在其中创建请求的可用区。

    输出类似于以下内容:

    autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z'
    creationTimestamp: '2025-11-27T11:14:58.305-08:00'
    deploymentType: DENSE
    id: '7979651787097007552'
    kind: compute#futureReservation
    name: example-draft-request
    planningStatus: DRAFT
    reservationName: example-reservation
    schedulingType: INDEPENDENT
    selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request
    selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552
    specificReservationRequired: true
    specificSkuProperties:
      instanceProperties:
        guestAccelerators:
        -   acceleratorCount: 8
          acceleratorType: nvidia-h200-141gb
        localSsds:
        -   diskSizeGb: '375'
          interface: NVME
        ...
      machineType: a3-ultragpu-8g
    totalCount: '2'
    status:
      autoCreatedReservations:
      -   https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation
      fulfilledCount: '2'
      lockTime: '2026-01-27T19:15:00Z'
      procurementStatus: DRAFTING
    timeWindow:
      endTime: '2026-02-10T19:20:00Z'
      startTime: '2026-01-27T19:20:00Z'
    zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b
    
  4. 在命令输出中,验证预留期和共享 类型等请求详细信息是否正确。此外,如果您购买了承诺,请验证是否已指定承诺。如果 详细信息不正确,请与您的客户支持团队联系。
  5. 如需提交请求草稿以供审核,请使用 gcloud compute future-reservations update command,并将 --planning-status 标志设置为 SUBMITTED
    gcloud compute future-reservations update FUTURE_RESERVATION_NAME \
        --planning-status=SUBMITTED \
        --zone=ZONE
    

    会在几分钟内 Google Cloud 批准您的请求,然后 Compute Engine 会创建一个包含您请求的资源的空预留。

REST

  1. 如需查看项目中的未来预留请求列表,请向 futureReservations.list 方法发出 GET 请求。 在请求网址中添加 filter 查询参数并将其设置为 status.procurementStatus=DRAFTING
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
    

    替换以下内容:

    • PROJECT_ID:Google 在其中创建未来预留请求草稿的项目的 ID。
    • ZONE:请求所在的可用区。
  2. 在请求输出中,查找您向 客户支持团队提供的名称对应的预留请求。
  3. 如需查看请求草稿的详细信息,请向 Beta 版 futureReservations.get 方法发出 GET 请求:
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
    

    FUTURE_RESERVATION_NAME 替换为未来 预留请求草稿的名称。

    输出类似于以下内容:

    {
      "specificSkuProperties": {
        "instanceProperties": {
          "machineType": "a3-ultragpu-8g",
          "guestAccelerators": [
            {
              "acceleratorType": "nvidia-h200-141gb",
              "acceleratorCount": 8
            }
          ],
          "localSsds": [
            {
              "diskSizeGb": "375",
              "interface": "NVME"
            },
            ...
          ]
        },
        "totalCount": "2"
      },
      "kind": "compute#futureReservation",
      "id": "7979651787097007552",
      "creationTimestamp": "2025-11-27T11:14:58.305-08:00",
      "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request",
      "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552",
      "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b",
      "name": "example-draft-request",
      "timeWindow": {
        "startTime": "2026-01-27T19:20:00Z",
        "endTime": "2026-02-10T19:20:00Z"
      },
      "status": {
        "procurementStatus": "DRAFTING",
        "lockTime": "2026-01-27T19:15:00Z"
      },
      "planningStatus": "DRAFT",
      "specificReservationRequired": true,
      "reservationName": "example-reservation",
      "deploymentType": "DENSE",
      "schedulingType": "INDEPENDENT",
      "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z"
    }
    
  4. 在输出中,验证预留期和共享类型等请求详细信息是否正确, 此外,如果您请求了承诺,请验证是否已指定承诺。如果 详细信息不正确,请与您的客户支持团队联系。
  5. 如需提交请求草稿以供审核,请向 Beta 版 futureReservations.update 方法发出 PATCH 请求。 在请求网址中添加 updateMask 查询参数并将其设置为 planningStatus:
    PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "planningStatus": "SUBMITTED"
    }
    

    会在几分钟内 Google Cloud 批准您的请求,然后 Compute Engine 会创建一个包含您请求的资源的空预留。

后续步骤