请求 TPU Spot 虚拟机

Spot 虚拟机以大幅折扣费率提供未使用的容量。虽然 Spot 虚拟机随时可能被抢占,但与抢占式 TPU 不同,Spot 虚拟机的运行时长没有限制。如需重启 Spot 虚拟机实例或 MIG,您必须先将其删除,然后再重新创建。

如需详细了解 Spot 虚拟机,请参阅 Compute Engine 文档中的 Spot 虚拟机

创建 TPU Spot 虚拟机

您可以创建 TPU Spot 虚拟机,将其作为单个实例或作为代管式实例组 (MIG) 的一部分。

如需使用 MIG 创建 TPU Spot 虚拟机,请在实例模板中指定 Spot 预配模型。

  1. 创建实例模板

        gcloud compute instance-templates create TEMPLATE_NAME \
            --provisioning-model=SPOT \
            --instance-termination-action=DELETE \
            --machine-type=MACHINE_TYPE \
            --image-family=IMAGE_FAMILY \
            --image-project=IMAGE_PROJECT \
            --zone=ZONE \
            --maintenance-policy=TERMINATE
    

    替换以下占位符:

    • TEMPLATE_NAME:实例模板的名称。
    • MACHINE_TYPE:虚拟机的机器类型。
    • IMAGE_FAMILY:TPU 虚拟机的操作系统映像系列。
    • IMAGE_PROJECT:TPU 虚拟机的操作系统映像项目。
    • ZONE:创建实例模板的可用区。
  2. 创建工作负载政策

    以下命令会创建工作负载政策。对于单主机 slice,此属性是可选的。

    gcloud compute resource-policies create workload WORKLOAD_POLICY_NAME \
    --type=high-throughput \
    --accelerator-topology=TOPOLOGY
    

    替换以下占位符:

    • WORKLOAD_POLICY_NAME:工作负载政策的名称。
    • TOPOLOGY:TPU 虚拟机的拓扑,例如 4x4x8
  3. 创建 MIG

        gcloud compute instance-groups managed create MIG_NAME \
            --zone=ZONE \
            --template=TEMPLATE_NAME \
            --size=SIZE \
            --workload-policy=projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME
    

    替换以下占位符:

    • MIG_NAME:MIG 的名称。
    • ZONE:创建 MIG 的可用区。
    • TEMPLATE_NAME:实例模板的名称。
    • SIZE:MIG 中的实例数量。
    • PROJECT_ID:您的 Google Cloud 项目的 ID。
    • WORKLOAD_POLICY_REGION:工作负载政策的定义区域。
    • WORKLOAD_POLICY_NAME:工作负载政策的名称。

使用单个 TPU 虚拟机

您还可以创建单个 TPU Spot 虚拟机。

gcloud compute instances create TPU_NAME \
    --zone=ZONE \
    --provisioning-model=SPOT \
    --instance-termination-action=DELETE \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --maintenance-policy=TERMINATE

替换以下占位符:

  • TPU_NAME:TPU 的名称。
  • ZONE:创建 TPU 的可用区。
  • MACHINE_TYPE:虚拟机的机器类型。
  • IMAGE_FAMILY:实例模板的映像系列。
  • IMAGE_PROJECT:TPU 虚拟机的操作系统映像项目。

如需详细了解 Compute Engine 中的 Spot 虚拟机,请参阅 Spot 虚拟机

价格和配额

TPU Spot 虚拟机的价格远低于按需 TPU 和预留的 TPU。如需详细了解价格,请参阅 Cloud TPU 价格

您需要有抢占式配额才能使用 TPU Spot 虚拟机。如需了解详情,请参阅配额

后续步骤