在全容量模式下请求 TPU 容量

请与您的 Google Cloud 客户支持团队联系,请求全容量模式预留。

在全容量模式下请求 TPU 容量,并可选择共享项目

请与您的客户支持团队联系,并提供所需的初始信息。您的客户支持团队将创建处于草稿状态的未来预留,供您通过 Google Cloud 控制台进行审核。

您可以请求可在组织中的其他 Google Cloud项目之间共享的预留。您还可以请求可与其他 Google Cloud 服务(例如 Vertex AI)共享的预留。在向客户支持团队提供的初始信息中指明您的预留共享偏好设置:

属性 说明
项目编号 您的客户支持团队创建请求且 Compute Engine 预配容量的项目的编号(而非 ID)。
TPU 世代 Trillium 或 Ironwood
可用区 您要在其中预留容量的可用区。
芯片数量 要预留的 TPU 芯片总数。
开始时间 预留期的开始时间
结束时间 预留期的结束时间
预留名称 Compute Engine 创建的用于交付预留容量的预留的名称
预留自动删除 您是否希望 Compute Engine 在预留期结束时自动删除自动创建的预留。如果您想手动删除预留,则必须与您的客户支持团队联系,以删除预留。
共享类型 只有您的项目可以使用自动创建的预留 (LOCAL),还是其他项目也可以使用该预留 (SPECIFIC_PROJECTS)。提交请求后,您无法更改此设置。如需与组织中的其他项目共享预留的容量,请执行以下操作:
  1. 验证 Google 在其中创建请求的项目是否可以创建共享预留(如果您尚未这样做)。
  2. 提供要与之共享预留容量的项目的 ID。您最多可以指定组织中的 100 个项目。
承诺名称 如果预留期为一年或更长时间,则您必须购买基于资源的承诺并将其附加到预留的资源。您可以购买 1 年期或 3 年期承诺方案。如果您与其他项目共享预留的容量,则只有这些项目使用与预留容量的项目相同的 Cloud Billing 账号时才会获得折扣。如需了解详情,请参阅为基于资源的承诺启用 CUD 共享

系统会为全容量模式预留预设以下属性:

属性 说明
维护调度类型 Compute Engine 如何为集群中的虚拟机安排主机维护。TPU Cluster Director 仅支持 GROUPED 选项,这意味着维护会在预留的子块中的所有 TPU 虚拟机之间同步。
预留运行模式 Google Cloud 在出现主机错误或主机故障报告后如何管理虚拟机恢复流程。TPU Cluster Director 仅支持“ALL_CAPACITY“选项,这意味着您必须自行管理虚拟机的维护和恢复流程。不过,您可以完全访问预留中的所有机器,并更精细地控制虚拟机拓扑和维护。
部署类型 容量部署类型。TPU Cluster Director 仅支持“DENSE”。

确认容量预留草稿

您必须确认客户支持团队为您创建的预留草稿,才能在 Google Cloud 项目中获得 TPU Cluster Director 容量。按照查看并提交预留请求草稿中的说明确认预留。

查看容量请求的状态

您可以确定 TPU Cluster Director 容量请求的状态。如果请求获得批准,系统会在请求的开始时间分配容量,并持续到请求的时长结束。系统会在预留开始时间开始计费。

如需了解详情,请参阅查看未来预留

如需查看未来预留请求(名为“exfr1”的预留)的详细信息,请在 Google Cloud CLI 中运行以下命令:

gcloud compute future-reservations describe exfr1 \
    --zone=us-central1-a

输出类似于以下内容:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'exfr1'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

扩大现有容量请求

您可以通过现有预留获得额外容量。添加额外容量后,该容量会继承所有预留属性,例如预留共享政策。您可以针对额外容量请求 CUD。新的 CUD 将指向同一预留。您的客户支持团队会为您完成预留扩大流程。

通过 Google Cloud 控制台查看预留详细信息

未来预留完成后,您可以在 Google Cloud 控制台的“预留”页面上找到该预留并查看其详细信息。部署类型为 Dense 的 TPU 预留表示它是 TPU Cluster Director 预留。