在全容量模式下请求 TPU 容量
请与您的 Google Cloud 客户支持团队联系,请求全容量模式预留。
在全容量模式下请求 TPU 容量,并可选择共享项目
请与您的客户支持团队联系,并提供所需的初始信息。您的客户支持团队将创建处于草稿状态的未来预留,供您通过 Google Cloud 控制台进行审核。
您可以请求可在组织中的其他 Google Cloud项目之间共享的预留。您还可以请求可与其他 Google Cloud 服务(例如 Vertex AI)共享的预留。在向客户支持团队提供的初始信息中指明您的预留共享偏好设置:
| 属性 | 说明 |
|---|---|
| 项目编号 | 您的客户支持团队创建请求且 Compute Engine 预配容量的项目的编号(而非 ID)。 |
| TPU 世代 | Trillium 或 Ironwood |
| 可用区 | 您要在其中预留容量的可用区。 |
| 芯片数量 | 要预留的 TPU 芯片总数。 |
| 开始时间 | 预留期的开始时间 |
| 结束时间 | 预留期的结束时间 |
| 预留名称 | Compute Engine 创建的用于交付预留容量的预留的名称 |
| 预留自动删除 | 您是否希望 Compute Engine 在预留期结束时自动删除自动创建的预留。如果您想手动删除预留,则必须与您的客户支持团队联系,以删除预留。 |
| 共享类型 | 只有您的项目可以使用自动创建的预留 (LOCAL),还是其他项目也可以使用该预留 (SPECIFIC_PROJECTS)。提交请求后,您无法更改此设置。如需与组织中的其他项目共享预留的容量,请执行以下操作:
|
| 承诺名称 | 如果预留期为一年或更长时间,则您必须购买基于资源的承诺并将其附加到预留的资源。您可以购买 1 年期或 3 年期承诺方案。如果您与其他项目共享预留的容量,则只有这些项目使用与预留容量的项目相同的 Cloud Billing 账号时才会获得折扣。如需了解详情,请参阅为基于资源的承诺启用 CUD 共享。 |
系统会为全容量模式预留预设以下属性:
| 属性 | 说明 |
|---|---|
| 维护调度类型 | Compute Engine 如何为集群中的虚拟机安排主机维护。TPU Cluster Director 仅支持 GROUPED 选项,这意味着维护会在预留的子块中的所有 TPU 虚拟机之间同步。 |
| 预留运行模式 | Google Cloud 在出现主机错误或主机故障报告后如何管理虚拟机恢复流程。TPU Cluster Director 仅支持“ALL_CAPACITY“选项,这意味着您必须自行管理虚拟机的维护和恢复流程。不过,您可以完全访问预留中的所有机器,并更精细地控制虚拟机拓扑和维护。 |
| 部署类型 | 容量部署类型。TPU Cluster Director 仅支持“DENSE”。 |
确认容量预留草稿
您必须确认客户支持团队为您创建的预留草稿,才能在 Google Cloud 项目中获得 TPU Cluster Director 容量。按照查看并提交预留请求草稿中的说明确认预留。
查看容量请求的状态
您可以确定 TPU Cluster Director 容量请求的状态。如果请求获得批准,系统会在请求的开始时间分配容量,并持续到请求的时长结束。系统会在预留开始时间开始计费。
如需了解详情,请参阅查看未来预留。
如需查看未来预留请求(名为“exfr1”的预留)的详细信息,请在 Google Cloud CLI 中运行以下命令:
gcloud compute future-reservations describe exfr1 \ --zone=us-central1-a
输出类似于以下内容:
creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'exfr1'
aggregateReservations:
vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
lockTime: 2024-03-01T17:00:00Z
procurementStatus: APPROVED
timeWindow:
endTime: 2025-06-01T17:00:00Z
startTime: 2024-05-01T17:00:00Z
...
扩大现有容量请求
您可以通过现有预留获得额外容量。添加额外容量后,该容量会继承所有预留属性,例如预留共享政策。您可以针对额外容量请求 CUD。新的 CUD 将指向同一预留。您的客户支持团队会为您完成预留扩大流程。
通过 Google Cloud 控制台查看预留详细信息
未来预留完成后,您可以在 Google Cloud 控制台的“预留”页面上找到该预留并查看其详细信息。部署类型为 Dense 的 TPU 预留表示它是 TPU Cluster Director 预留。