Solicitar VMs spot de TPU
As VMs spot oferecem capacidade não utilizada a taxas com grandes descontos. Embora as VMs spot possam ser interrompidas a qualquer momento, elas não têm uma duração máxima do ambiente de execução, ao contrário das TPUs preemptivas. Para reiniciar uma instância ou um MIG de VMs spot, é necessário excluir e recriar.
Para mais informações sobre VMs spot, consulte a documentação do Compute Engine sobre VMs spot.
Criar VMs spot de TPU
É possível criar VMs spot de TPU como instâncias individuais ou como parte de um grupo gerenciado de instâncias (MIG, na sigla em inglês).
Como usar MIGs para frações de vários hosts (recomendado)
Para criar VMs spot de TPU com um MIG, especifique o modelo de provisionamento spot no modelo de instância.
Criar um modelo de instância:
gcloud compute instance-templates create TEMPLATE_NAME \ --provisioning-model=SPOT \ --instance-termination-action=DELETE \ --machine-type=MACHINE_TYPE \ --image-family=IMAGE_FAMILY \ --image-project=IMAGE_PROJECT \ --zone=ZONE \ --maintenance-policy=TERMINATESubstitua os seguintes marcadores de posição:
- TEMPLATE_NAME: o nome do modelo de instância.
- MACHINE_TYPE: o tipo de máquina da VM.
- IMAGE_FAMILY: a família de imagens do SO para a VM de TPU.
- IMAGE_PROJECT: o projeto de imagem do SO para a VM de TPU.
- ZONE: a zona em que o modelo de instância é criado.
Criar uma política de carga de trabalho
O comando a seguir cria uma política de carga de trabalho. Isso é opcional para frações de host único.
gcloud compute resource-policies create workload WORKLOAD_POLICY_NAME \ --type=high-throughput \ --accelerator-topology=TOPOLOGYSubstitua os seguintes marcadores de posição:
- WORKLOAD_POLICY_NAME: o nome da política de carga de trabalho.
- TOPOLOGY: a topologia das VMs de TPU, por exemplo,
4x4x8.
Criar o MIG:
gcloud compute instance-groups managed create MIG_NAME \ --zone=ZONE \ --template=TEMPLATE_NAME \ --size=SIZE \ --workload-policy=projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAMESubstitua os seguintes marcadores de posição:
- MIG_NAME: o nome do MIG.
- ZONE: a zona em que o MIG é criado.
- TEMPLATE_NAME: o nome do modelo de instância.
- SIZE: o número de instâncias no MIG.
- PROJECT_ID: o ID do seu Google Cloud projeto.
- WORKLOAD_POLICY_REGION: a região em que a política de carga de trabalho está definida.
- WORKLOAD_POLICY_NAME: o nome da política de carga de trabalho.
Como usar VMs de TPU únicas
Também é possível criar VMs spot de TPU únicas.
gcloud compute instances create TPU_NAME \
--zone=ZONE \
--provisioning-model=SPOT \
--instance-termination-action=DELETE \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--maintenance-policy=TERMINATE
Substitua os seguintes marcadores de posição:
- TPU_NAME: o nome da TPU.
- ZONE: a zona em que a TPU é criada.
- MACHINE_TYPE: o tipo de máquina da VM.
- IMAGE_FAMILY: a família de imagens do modelo de instância.
- IMAGE_PROJECT: o projeto de imagem do SO para a VM de TPU.
Para mais informações sobre VMs spot no Compute Engine, consulte VMs spot.
Preços e cotas
O preço das VMs spot de TPU é significativamente menor do que o das TPUs on demand e reservadas. Para mais informações sobre preços, consulte Preços do Cloud TPU.
Você precisa de uma cota preemptiva para usar as VMs spot de TPU. Saiba mais em veja Cotas.
A seguir
- Saiba como gerenciar TPUs