请求未来预留(日历模式),预留时间最长为 90 天

如需针对特定开始时间和时长(介于 1 到 90 天之间)预留 TPU,请在日历模式下请求未来预留。此模式由动态工作负载调度器提供支持,可让您提前最多 120 天查看 TPU 可用性,并根据您的安排请求容量。您可以使用 Compute Engine API 或 Google Cloud 控制台请求日历模式下的未来预留。如果获得批准,Compute Engine 会自动在您选择的日期和时间创建预留。然后,您可以使用 Create Node APIQueued Resources API 预配 TPU,从而使用预留。在预留期结束时,Compute Engine 会自动删除该预留以及使用该预留的所有 TPU。

未来预留(日历模式)最长可预留 90 天,非常适合需要精确开始时间且具有明确时长的训练和实验工作负载。

如需了解详情,请参阅日历模式下的未来预留请求简介

查看 TPU 的未来可用性

您可以提前 1 到 120 天查看 TPU 的可用性。如需了解详情,请参阅查看资源的未来可用情况

在日历模式下创建未来预留请求

您可以使用 Compute Engine API 或 Google Cloud 控制台以日历模式请求未来预留。如需了解详情,请参阅在日历模式下创建未来预留请求

限制

在日历模式下为 TPU 请求未来预留时,需要遵循以下限制:

  • 您无法修改、取消或删除未来预留请求。
  • 您必须指定预留时长,最短为 1 天,最长为 90 天。
  • 您只能在指定可用区中预留以下 TPU 版本:
    • TPU v6easia-northeast1-beurope-west4-aus-east5-aus-east5-b
    • TPU v5pus-east5-a
    • TPU v5e
      • europe-west4-bus-west4-b (BATCH)
      • us-south1-a (SERVING)

如需了解每个请求允许的 TPU 芯片数量,请参阅 Compute Engine 文档中的限制

后续步骤