本文档介绍了在您想使用 AI Hypercomputer 消费选项中的未来预留时,如何获取容量。如需了解 AI Hypercomputer 中的所有容量选项,请参阅容量概览。
为了确保工作负载拥有所需的资源,您可以向 Google 申请未来预留。此操作可让您预留指定时长的容量块,从您选择的特定日期和时间开始。Google 会根据您的请求创建未来预留请求草稿。在您审核并提交此请求草稿后,如果 Google Cloud批准了该请求,Compute Engine 会自动创建一个空预留。接着,Compute Engine 会在您选择的开始时间将您请求的容量预配到自动创建的预留中。然后,您可以使用预留来创建虚拟机 (VM) 实例,直至预留期结束。
限制
本部分介绍了针对未来预留请求以及针对请求的自动创建预留的限制。
未来预留请求的限制
Google 为您创建未来预留请求草稿后,需要遵循以下限制:
- 您无法修改请求详情,包括分享类型。
- 提交请求并获得批准后,当请求的状态更改为
PROVISIONING时,您将无法取消或删除该请求。您需承诺从请求开始时间起支付所请求容量的费用,无论使用情况如何。
自动创建的预留的限制
在 Compute Engine 创建按需预留以满足您请求的容量后,需要遵循以下限制:
- 您只能在请求开始时间之后使用或修改预留。
-
您只能按以下方式修改预留:
如需修改预留中的其他属性,您必须与您的客户支持团队联系。
- 您无法手动删除预留。如果您在预留容量时指定不希望在预留期结束时自动删除预留,则必须与您的客户支持团队联系才能删除预留。
准备工作
如果您尚未这样做,请查看可用的虚拟机和集群配置。
-
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
REST
如需在本地开发环境中使用本页面上的 REST API 示例,请使用您提供给 gcloud CLI 的凭证。
安装 Google Cloud CLI。 安装完成后,运行以下命令来初始化 Google Cloud CLI:
gcloud init如果您使用的是外部身份提供方 (IdP),则必须先使用联合身份登录 gcloud CLI。
如需了解详情,请参阅 Google Cloud 身份验证文档中的使用 REST 时进行身份验证。
所需的角色
如需获得创建未来预留请求所需的权限,请让您的管理员为您授予项目的 Compute Future Reservation User (
roles/compute.futureReservationUser) IAM 角色。 如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。此预定义角色包含创建未来预留请求所需的权限。如需查看所需的确切权限,请展开所需权限部分:
所需权限
创建未来预留请求需要具备以下权限:
-
让 Compute Engine 自动创建预留:针对项目的
compute.reservations.create权限 -
创建未来预留请求:针对项目的
compute.futureReservations.create权限 -
如需指定实例模板:实例模板的
compute.instanceTemplates.useReadOnly权限
Quota
在未来预留请求过程中,Google 会管理预留资源的配额。您无需申请配额。在已获批准的未来预留的开始时间,如果您缺少预留资源所需的配额,Google 会增加配额。
概览
如需预留容量块,请完成以下步骤:
- 通过客户支持团队申请容量。请与您的客户支持团队联系,指定您要预留的资源类型和数量。
- 查看并提交预留请求草稿。Google 创建未来预留请求草稿后,请对其进行审核。如果看起来正确无误,请提交审核请求。 Google Cloud 会立即批准该请求。
通过客户支持团队请求容量
与您的客户支持团队联系,并提供以下信息,以便 Google 创建未来预留请求草稿:
- 项目编号:您的客户支持团队创建请求且 Compute Engine 预配容量的项目的编号。
- 机器类型:要预留的机器类型。您可以指定以下其中一项:
- A4X (
a4x-highgpu-4g) - A4 (
a4-highgpu-8g) - A3 Ultra (
a3-ultragpu-8g) - A3 Mega (
a3-megagpu-8g) - A3 High (
a3-highgpu-8g)
- A4X (
- 可用区:您要在其中预留容量的可用区。 如需查看 GPU 机器类型的可用区域和可用区,请参阅加速器可用性。
- 总数:要预留的虚拟机总数。您只能预留 2 的倍数的虚拟机。每个块的块大小和虚拟机数量因机器类型和可用性而异。您的客户支持团队可以提供有关您的要求的更多详细信息。
- 开始时间:预留期的开始时间。届时,您就可以开始使用预留容量了。将开始时间格式设置为 RFC 3339 时间戳,如下所示:
YYYY-MM-DDTHH:MM:SSOFFSET
替换以下内容:
YYYY-MM-DD:格式为 4 位数年份、2 位数月份和 2 位数日期而且相互之间以连字符 (-) 分隔的日期。HH:MM:SS:格式为 2 位数小时、2 位数分钟和 2 位数秒而且相互之间以英文冒号 (:) 分隔的 24 小时制时间。OFFSET:采用世界协调时间 (UTC) 的偏移量格式的时区。 例如,如需使用太平洋标准时间 (PST),请指定-08:00。如需不使用偏移量,请指定Z。
- 结束时间:预留期的结束时间。将其格式设置为 RFC 3339 时间戳。届时,Compute Engine 会执行以下操作:
- Compute Engine 会删除自动创建的预留。
- 根据您为虚拟机实例指定的终止操作,Compute Engine 会停止或删除您使用自动创建的预留创建的任何虚拟机实例。
- 预留名称:Compute Engine 创建的用于交付预留容量的预留名称。Compute Engine 只能创建明确定向预留。
- 预留自动删除:您是否希望 Compute Engine 在预留期结束时自动删除自动创建的预留。如果您想手动删除预留,则必须与您的客户支持团队联系,才能删除预留。
- 维护安排类型:Compute Engine 如何为集群中的虚拟机实例安排主机维护。指定以下选项之一:
- 如需在预留块中的所有 A4X、A4 或 A3 Ultra 虚拟机之间同步维护,请使用
GROUPED。 - 如需为 A4 或 A3 Ultra 虚拟机使用不同的维护时间表,请使用
INDEPENDENT。
GROUPED和INDEPENDENT调度选项。您可以使用标准的 Compute Engine 主机维护政策,其中维护是按单个虚拟机安排的,而不是在整个集群中同步进行。由于这些附加了 GPU 的实例不支持实时迁移,因此它们会受到终止和重启政策的约束。 - 如需在预留块中的所有 A4X、A4 或 A3 Ultra 虚拟机之间同步维护,请使用
- 预留运行模式:在出现主机错误或主机故障报告后,由您还是 Google Cloud管理虚拟机恢复流程。您使用的模式取决于您预留的机器类型:
- 受管模式 (
HIGHLY_AVAILABLE_CAPACITY)。此模式适用于 A4、A3 Ultra、A3 Mega 和 A3 High 机器类型。您可以通过让 Google Cloud 自动替换有故障的机器来管理虚拟机的维护和恢复流程。此方法可提高虚拟机的可用性,并有助于您在新的主机上快速重启虚拟机。不过,在 Compute Engine 更换机器后,虚拟机的拓扑可能会发生变化。 - 所有容量模式 (
ALL_CAPACITY)。此模式适用于 A4X 机器类型。您必须手动管理虚拟机的维护和恢复流程。不过,您可以完全访问预留中的所有机器,并更精细地控制虚拟机拓扑和维护。
- 受管模式 (
- 共享类型:只有您的项目可以使用自动创建的预留 (
LOCAL),还是其他项目也可以使用该预留 (SPECIFIC_PROJECTS)。提交请求后,此属性便无法更改。如需与组织中的其他项目共享预留的容量,请执行以下操作:- 验证 Google 在其中创建请求的项目是否可以创建共享预留(如果您尚未这样做)。
- 提供要与之共享预留容量的项目的编号。您最多可以指定组织中的 100 个项目。
承诺名称:如果预留期为一年或更长时间,则您必须购买基于资源的承诺并将其附加到预留的资源。对于 1 年至不足 3 年的预留期限,承诺可让您享受 1 年期承诺使用折扣 (CUD) 费率。对于预留期限为 3 年至不足 6 年的承诺,您可享受 3 年期 CUD 费率。
如果您与其他项目共享预留容量,则这些项目只有在使用与预留容量的项目相同的 Cloud Billing 账号时才会获得折扣。如需了解详情,请参阅为基于资源的承诺启用 CUD 共享。
承诺的开始日期和结束日期与预留的开始日期和结束日期相同,但激活时间可能不同。如果您将预留开始时间指定为美国和加拿大太平洋时间凌晨零点,则承诺会在您选择的开始日期当天凌晨零点生效。如果您指定了其他开始时间,则承诺会在所选开始日期次日的凌晨零点生效。
Google 创建未来预留请求草稿后,您的客户支持团队会与您联系。
查看并提交预订请求草稿
在您向客户支持团队提供要预留的资源类型和数量后,Google 会创建未来预留请求草稿。您可以查看草稿请求,如果正确无误,请提交以供审核。您必须在请求开始时间之前提交请求。
如需查看并提交未来预留请求草稿,请选择以下选项之一:
控制台
在 Google Cloud 控制台中,前往预留页面。
- 点击未来预留标签页。 未来预留表会列出项目中的每个未来预留请求,表中的每一列描述一个属性。
- 在名称列中,点击 Google 为您创建的请求草稿的名称。系统会打开一个显示相应未来预留请求详细信息的页面。
- 在基本信息部分中,验证请求详细信息(例如日期和共享类型)是否正确。此外,如果您请求了承诺,请验证是否已指定承诺。如果上述任何详细信息不正确,请与您的客户支持团队联系。
如果一切看起来都准确无误,请提交申请:
- 点击 修改草稿。 系统随即会显示用于修改草稿请求的页面。
- 点击创建。系统会显示预留页面。 Google Cloud 会在几分钟内批准您的请求,然后 Compute Engine 会创建一个包含您请求的资源的空预留。
gcloud
- 如需查看项目中的未来预留请求列表,请使用
gcloud compute future-reservations list命令,并将--filter标志设置为PROCUREMENT_STATUS=DRAFTING:gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
- 在命令输出中,查找您向客户支持团队提供的名称对应的预留请求。
- 如需查看请求草稿的详细信息,请使用
gcloud compute future-reservations describe命令:gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \ --zone=ZONE替换以下内容:
FUTURE_RESERVATION_NAME:未来预留请求草稿的名称。ZONE:Google 在其中创建请求的可用区。
输出类似于以下内容:
autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z' creationTimestamp: '2025-11-27T11:14:58.305-08:00' deploymentType: DENSE id: '7979651787097007552' kind: compute#futureReservation name: example-draft-request planningStatus: DRAFT reservationName: example-reservation schedulingType: INDEPENDENT selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552 specificReservationRequired: true specificSkuProperties: instanceProperties: guestAccelerators: - acceleratorCount: 8 acceleratorType: nvidia-h200-141gb localSsds: - diskSizeGb: '375' interface: NVME ... machineType: a3-ultragpu-8g totalCount: '2' status: autoCreatedReservations: - https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation fulfilledCount: '2' lockTime: '2026-01-27T19:15:00Z' procurementStatus: DRAFTING timeWindow: endTime: '2026-02-10T19:20:00Z' startTime: '2026-01-27T19:20:00Z' zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b - 在命令输出中,验证请求详细信息(例如预留期和共享类型)是否正确。 此外,如果您购买了承诺,请验证是否已指定承诺。如果上述任何详细信息不正确,请与您的客户支持团队联系。
- 如需提交请求草稿以供审核,请使用
gcloud compute future-reservations update命令,并将--planning-status标志设置为SUBMITTED:gcloud compute future-reservations update FUTURE_RESERVATION_NAME \ --planning-status=SUBMITTED \ --zone=ZONEGoogle Cloud 会在几分钟内批准您的请求,然后 Compute Engine 会创建一个包含您请求的资源的空预留。
REST
- 如需查看项目中的未来预留请求列表,请向
futureReservations.list方法发出GET请求。 在请求网址中添加filter查询参数并将其设置为status.procurementStatus=DRAFTING:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
替换以下内容:
PROJECT_ID:Google 在其中创建未来预留请求草稿的项目的 ID。ZONE:请求所在的可用区。
- 在请求输出中,查找您向客户支持团队提供的名称对应的预留请求。
- 如需查看请求草稿的详细信息,请向 Beta 版
futureReservations.get方法发出GET请求:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
将
FUTURE_RESERVATION_NAME替换为草稿未来预留请求的名称。输出类似于以下内容:
{ "specificSkuProperties": { "instanceProperties": { "machineType": "a3-ultragpu-8g", "guestAccelerators": [ { "acceleratorType": "nvidia-h200-141gb", "acceleratorCount": 8 } ], "localSsds": [ { "diskSizeGb": "375", "interface": "NVME" }, ... ] }, "totalCount": "2" }, "kind": "compute#futureReservation", "id": "7979651787097007552", "creationTimestamp": "2025-11-27T11:14:58.305-08:00", "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request", "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552", "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b", "name": "example-draft-request", "timeWindow": { "startTime": "2026-01-27T19:20:00Z", "endTime": "2026-02-10T19:20:00Z" }, "status": { "procurementStatus": "DRAFTING", "lockTime": "2026-01-27T19:15:00Z" }, "planningStatus": "DRAFT", "specificReservationRequired": true, "reservationName": "example-reservation", "deploymentType": "DENSE", "schedulingType": "INDEPENDENT", "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z" } - 在输出中,验证预留期和共享类型等请求详细信息是否正确。此外,如果您请求了承诺,请验证是否已指定承诺。如果上述任何详细信息不正确,请与您的客户支持团队联系。
- 如需提交请求草稿以供审核,请向 Beta 版
futureReservations.update方法发出PATCH请求。在请求网址中,添加updateMask查询参数并将其设置为planningStatus:PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus { "name": "FUTURE_RESERVATION_NAME", "planningStatus": "SUBMITTED" }Google Cloud 会在几分钟内批准您的请求,然后 Compute Engine 会创建一个包含您请求的资源的空预留。
后续步骤
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2026-02-26。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2026-02-26。"],[],[]] -
让 Compute Engine 自动创建预留:针对项目的