本文档介绍了当您想要使用 AI Hypercomputer 使用选项中的未来预留时,如何获取容量。 如需了解 AI Hypercomputer 中的所有容量选项,请参阅 容量概览。
如需确保工作负载拥有所需的资源,请向 Google 请求未来 预留。此操作可让您预留容量块,预留时长由您定义, 从您选择的特定日期和时间开始。Google 会根据您的请求创建 未来预留请求草稿。在您审核并提交此请求草稿后,如果 Google Cloud 批准了该请求,Compute Engine 会自动创建 (自动创建) 一个空预留。 接着,Compute Engine 会在您选择的开始时间将您请求的容量预配到 自动创建的预留中。然后,您可以使用该预留创建 Compute Engine 实例 ,直至预留期结束。
限制
本部分介绍了针对未来预留请求以及针对请求自动创建的 预留的限制。
针对未来预留请求的限制
在 Google 为您创建未来预留请求草稿后,需要遵循以下限制 :
- 您无法修改请求详细信息,包括共享类型。
- 提交请求并获得批准后,如果请求状态变为
PROVISIONING, ,您将无法取消或删除该请求。无论使用情况如何,您都必须承诺从请求 开始时间起支付所请求容量的费用。
针对自动创建的预留的限制
在 Compute Engine 创建按需预留以满足您请求的容量后, 需要遵循以下限制:
- 您只能在请求开始时间之后使用或修改预留。
-
您只能按如下方式修改预留:
如需修改预留中的其他属性,您必须与您的客户支持团队联系。
- 您无法手动删除预留。如果您在预留容量时指定不希望在预留期结束时自动删除预留,则必须与您的客户支持团队联系以删除预留。
准备工作
-
-
选择标签页以了解您打算如何使用本页面上的示例:
控制台
当您使用 Google Cloud 控制台访问 Google Cloud 服务和 API 时,无需设置身份验证。
gcloud
在 Google Cloud 控制台中,激活 Cloud Shell。
Cloud Shell 会话随即会在控制台的底部启动,并显示命令行提示符。 Google Cloud Cloud Shell 是一个已安装 Google Cloud CLI 且已为当前项目设置值的 Shell 环境 。该会话可能需要几秒钟来完成初始化。
REST
如需在本地开发环境中使用本页面上的 REST API 示例,请使用您提供给 gcloud CLI 的 凭证。
安装 Google Cloud CLI。
如果您使用的是外部身份提供方 (IdP),则必须先 使用联合身份登录 gcloud CLI。
如需了解详情,请参阅 身份验证文档 中的 Google Cloud 使用 REST 时进行身份验证。
所需的角色
如需获得创建未来预留请求所需的权限,请让您的管理员为您授予项目的 Compute Future Reservation User (roles/compute.futureReservationUser) IAM 角色。
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
此预定义角色包含 创建未来预留请求所需的权限。如需查看所需的确切权限,请展开所需权限部分:
所需权限
创建未来预留请求需要具备以下权限:
-
允许 Compute Engine 自动创建预留:
compute.reservations.create针对项目的 -
创建未来预留请求:针对项目的
compute.futureReservations.create权限 -
如需指定实例模板:实例模板的
compute.instanceTemplates.useReadOnly权限
Quota
在未来预留请求过程中,Google 会管理预留 资源的配额。您无需申请配额。在已获批准的未来预留的开始时间, 如果您的项目没有足够的预留 资源配额,Google 会自动增加配额。
概览
如需预留容量块,请完成以下步骤:
- 通过客户支持团队请求容量 。与您的客户支持团队联系,指定您要预留的资源类型 和数量。
- 审核并提交预留请求草稿 。在 Google 创建未来 预留请求草稿后,请对其进行审核。如果看起来正确无误,请提交请求以供审核。 Google Cloud 会立即批准该请求。
通过客户支持团队请求容量
与您的客户支持团队联系,并提供以下信息,以便 Google 创建未来预留请求草稿:
- 项目编号:您的客户支持团队创建请求且 Compute Engine 预配容量的项目的编号。
- 机器类型:要预留的机器类型。您可以指定以下类型之一:
- A4X Max (
a4x-maxgpu-4g-metal) - A4X (
a4x-highgpu-4g) - A4 (
a4-highgpu-8g) - A3 Ultra (
a3-ultragpu-8g) - A3 Mega (
a3-megagpu-8g) - A3 High (
a3-highgpu-8g)
- A4X Max (
- 可用区:您要在其中预留容量的可用区。 如需查看 GPU 机器类型的可用区域和可用区,请参阅 加速器可用性。
- 总数:要预留的计算实例总数。您只能预留 计算实例的倍数。每个块的块大小和计算实例数量因机器类型和可用性而异。您的客户支持团队可以提供有关您的请求的更多详细信息。
- 开始时间:预留期的开始时间。您可以从该时间开始使用预留的
容量。将开始时间的格式设置为 RFC 3339 时间戳,如下所示:
YYYY-MM-DDTHH:MM:SSOFFSET
替换以下内容:
YYYY-MM-DD:日期格式为四位数年份、两位数月份、 两位数日期,以连字符 (-) 分隔。HH:MM:SS:时间格式为两位数小时(使用 24 小时 制)、两位数分钟和两位数秒,以英文冒号 (:) 分隔。OFFSET:采用 世界协调时间 (UTC) 的偏移量格式的时区。例如,如需使用太平洋标准时间 (PST),请指定-08:00。如需 不使用偏移量,请指定Z。
- 结束时间:预留期的结束时间。将其格式设置为 RFC 3339 时间戳。届时,Compute Engine 会执行以下操作:
- Compute Engine 会删除自动创建的预留。
- 根据您为 终止操作指定的 计算实例 ,Compute Engine 会停止或删除您使用自动创建的预留创建的任何 计算实例 。
- 预留名称:Compute Engine 创建的用于 交付预留容量的预留名称。Compute Engine 只能创建 明确定向预留。
- 预留自动删除:您是否希望 Compute Engine 在预留期结束时自动 删除自动创建的预留。如果您想手动 删除预留,则必须与您的客户支持团队联系以删除预留。
- 维护安排类型:Compute Engine 如何为集群中的计算实例安排主机维护。指定
以下选项之一:
- 如需在预留块中的所有 A4X Max、A4X、A4 或 A3 Ultra 实例之间同步维护,请使用
GROUPED。 - 如需为 A4 或 A3 Ultra 实例使用不同的维护时间表,请使用
INDEPENDENT。
- 如需在预留块中的所有 A4X Max、A4X、A4 或 A3 Ultra 实例之间同步维护,请使用
- 预留运行模式:在主机错误或故障主机报告后,您或 Google Cloud 是否管理计算实例恢复流程。您使用的模式取决于您预留的机器类型:
- 所有容量模式 (
ALL_CAPACITY)。此模式仅适用于 A4X Max 和 A4X 机器 类型。您必须手动管理计算实例的维护和恢复流程。不过,您可以完全访问预留中的所有机器,并对计算实例拓扑和维护进行更精细的控制。 - 受管理模式 (
HIGHLY_AVAILABLE_CAPACITY)。此模式仅适用于 A4、A3 Ultra、 A3 Mega 和 A3 High 机器类型。您可以通过自动替换故障机器,让 Google Cloud 管理计算实例的维护和 恢复流程。这种方法可以提高计算实例的可用性,并帮助您在新的主机上快速重启这些实例。不过,在 Compute Engine 替换机器后,计算实例的拓扑可能会发生变化。
- 所有容量模式 (
- 共享类型:只有您的项目可以使用自动创建的
预留 (
LOCAL),还是其他项目也可以使用该预留 (SPECIFIC_PROJECTS)。提交 请求后,此属性无法更改。如需与组织中的其他项目共享预留的容量,请执行以下操作:- 验证 Google 在其中创建请求的项目是否可以创建共享预留(如果您尚未这样做)。
- 提供要与其共享预留容量的项目的编号。您最多可以指定组织中的 100 个项目。
承诺名称:如果预留期为一年或更长时间,则您必须购买并附加基于资源的承诺到预留的资源。对于 1 年到 3 年以下的预留期,承诺 可让您享受 1 年期承诺使用折扣 (CUD) 费率。对于 3 年到 6 年以下的预留期,承诺可让您享受 3 年期 CUD 费率。
如果您与其他项目共享预留容量,则这些项目只有 在使用与预留容量的项目相同的 Cloud Billing 帐号时才会获得折扣。如需了解详情,请参阅为基于资源的承诺启用 CUD 共享。
承诺的开始日期和结束日期与预留相同,但激活时间 可能不同。如果您将预留开始时间指定为美国和加拿大太平洋时间凌晨零点, 则承诺会在您选择的开始日期当天凌晨零点生效。如果您指定了其他开始时间,则承诺会在所选开始日期次日的凌晨零点生效。
在 Google 创建未来预留请求草稿后,您的客户支持团队会与您联系。
审核并提交预留请求 草稿
在您向客户支持团队提供要预留的资源类型和数量后,Google 会创建未来预留请求草稿。您可以审核请求草稿,如果正确无误,则 提交以供审核。您必须在请求开始时间之前提交请求。
如需审核并提交未来预留请求草稿,请选择以下选项之一:
控制台
在 Google Cloud 控制台中,前往预留页面。
- 点击未来预留 标签页。未来预留 表会列出项目中的每个未来 预留请求,表中的每一列描述一个属性。
- 在名称 列中,点击 Google 为您创建的请求草稿的名称。系统会打开一个显示相应未来预留请求详细信息的页面。A
- 在基本信息 部分中,验证请求详细信息(例如日期 和共享类型 )是否正确。此外,如果您请求了承诺,请验证是否已 指定承诺。如果上述任何详细信息不正确,请与您的客户支持团队联系。
如果一切看起来都准确无误,请提交请求:
- 点击 修改草稿。系统会显示一个用于修改请求草稿 的页面。
- 点击创建 。系统会显示预留 页面。 Google Cloud 会在几分钟内批准您的 请求,然后 Compute Engine 会创建一个包含您请求的资源的空预留 。
gcloud
- 如需查看项目中的未来预留请求列表,请使用
gcloud compute future-reservations list命令 ,并将--filter标志设置为PROCUREMENT_STATUS=DRAFTING:gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
- 在命令输出中,查找您向 客户支持团队提供的名称对应的预留请求。
- 如需查看请求草稿的详细信息,请使用
gcloud compute future-reservations describe命令:gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \ --zone=ZONE替换以下内容:
FUTURE_RESERVATION_NAME:未来预留请求草稿的名称 。ZONE:Google 在其中创建请求的可用区。
输出类似于以下内容:
autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z' creationTimestamp: '2025-11-27T11:14:58.305-08:00' deploymentType: DENSE id: '7979651787097007552' kind: compute#futureReservation name: example-draft-request planningStatus: DRAFT reservationName: example-reservation schedulingType: INDEPENDENT selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552 specificReservationRequired: true specificSkuProperties: instanceProperties: guestAccelerators: - acceleratorCount: 8 acceleratorType: nvidia-h200-141gb localSsds: - diskSizeGb: '375' interface: NVME ... machineType: a3-ultragpu-8g totalCount: '2' status: autoCreatedReservations: - https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation fulfilledCount: '2' lockTime: '2026-01-27T19:15:00Z' procurementStatus: DRAFTING timeWindow: endTime: '2026-02-10T19:20:00Z' startTime: '2026-01-27T19:20:00Z' zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b - 在命令输出中,验证预留期和共享 类型等请求详细信息是否正确。此外,如果您购买了承诺,请验证是否已指定承诺。如果 详细信息不正确,请与您的客户支持团队联系。
- 如需提交请求草稿以供审核,请使用
gcloud compute future-reservations updatecommand,并将--planning-status标志设置为SUBMITTED:gcloud compute future-reservations update FUTURE_RESERVATION_NAME \ --planning-status=SUBMITTED \ --zone=ZONE会在几分钟内 Google Cloud 批准您的请求,然后 Compute Engine 会创建一个包含您请求的资源的空预留。
REST
- 如需查看项目中的未来预留请求列表,请向
futureReservations.list方法发出GET请求。 在请求网址中添加filter查询参数并将其设置为status.procurementStatus=DRAFTING:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
替换以下内容:
PROJECT_ID:Google 在其中创建未来预留请求草稿的项目的 ID。ZONE:请求所在的可用区。
- 在请求输出中,查找您向 客户支持团队提供的名称对应的预留请求。
- 如需查看请求草稿的详细信息,请向
Beta 版
futureReservations.get方法发出GET请求:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
将
FUTURE_RESERVATION_NAME替换为未来 预留请求草稿的名称。输出类似于以下内容:
{ "specificSkuProperties": { "instanceProperties": { "machineType": "a3-ultragpu-8g", "guestAccelerators": [ { "acceleratorType": "nvidia-h200-141gb", "acceleratorCount": 8 } ], "localSsds": [ { "diskSizeGb": "375", "interface": "NVME" }, ... ] }, "totalCount": "2" }, "kind": "compute#futureReservation", "id": "7979651787097007552", "creationTimestamp": "2025-11-27T11:14:58.305-08:00", "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request", "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552", "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b", "name": "example-draft-request", "timeWindow": { "startTime": "2026-01-27T19:20:00Z", "endTime": "2026-02-10T19:20:00Z" }, "status": { "procurementStatus": "DRAFTING", "lockTime": "2026-01-27T19:15:00Z" }, "planningStatus": "DRAFT", "specificReservationRequired": true, "reservationName": "example-reservation", "deploymentType": "DENSE", "schedulingType": "INDEPENDENT", "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z" } - 在输出中,验证预留期和共享类型等请求详细信息是否正确, 此外,如果您请求了承诺,请验证是否已指定承诺。如果 详细信息不正确,请与您的客户支持团队联系。
- 如需提交请求草稿以供审核,请向
Beta 版
futureReservations.update方法发出PATCH请求。 在请求网址中添加updateMask查询参数并将其设置为planningStatus:PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus { "name": "FUTURE_RESERVATION_NAME", "planningStatus": "SUBMITTED" }会在几分钟内 Google Cloud 批准您的请求,然后 Compute Engine 会创建一个包含您请求的资源的空预留。