Criar VMs do Cloud TPU
Você cria VMs de TPU usando a API Create Node, a API de recursos enfileirados ou o Google Kubernetes Engine (GKE).
Você chama a API Create Node quando executa o comando gcloud compute tpus tpu-vm create
usando a Google Cloud CLI e quando cria uma VM de TPU usando o
consoleGoogle Cloud . Quando você usa a API Create Node, o sistema processa sua
solicitação imediatamente. Se não houver capacidade suficiente para atender à solicitação,
ela vai falhar.
Recomendamos criar VMs de TPU usando a API de recursos em fila. Ao criar uma VM de TPU usando a API de recursos em fila, o serviço Cloud TPU adiciona sua solicitação de recurso em fila a uma fila que o serviço mantém. Quando o recurso solicitado fica disponível, o serviço o atribui ao projeto do Google Cloud para uso imediato e exclusivo. Para mais informações, consulte Gerenciar recursos em fila.
Se você quiser usar o Google Kubernetes Engine (GKE) para gerenciar recursos de TPU, primeiro crie um cluster do GKE. Em seguida, adicione pools de nós com frações de TPU ao cluster. Para mais informações, consulte Sobre TPUs no GKE.
Pré-requisitos
Atenda aos seguintes pré-requisitos:
Crie um projeto Google Cloud para suas TPUs, conforme descrito em Configurar um projeto Google Cloud para TPUs.
Determine os requisitos de TPU conforme descrito em Planejar os recursos do Cloud TPU.
Se você estiver usando uma das bibliotecas de cliente do Cloud, siga as instruções de configuração para a linguagem em uso:
Defina variáveis de ambiente para criar uma TPU v5e com oito chips. Os exemplos a seguir usam uma TPU v5e com oito chips. É possível especificar um tipo e uma versão de acelerador diferentes. Consulte Versões de TPU para mais informações.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Criar um Cloud TPU usando a API Create Node
É possível criar um Cloud TPU usando gcloud, o console do Google Cloud
ou a API Cloud TPU.
Ao criar um Cloud TPU, especifique a versão do software de TPU (também chamada de versão de ambiente de execução). Para determinar qual versão do software usar, consulte Versões de software de TPU.
Além disso, especifique o número de TensorCores ou chips de TPU para a configuração de TPU que você está usando. Para mais informações, consulte a seção sobre sua versão de TPU em Arquitetura do sistema.
gcloud
Use o comando gcloud compute tpus tpu-vm create
para criar uma TPU usando a API Create Node. Consulte
Endereços IP internos e externos
para configurar endereços IP internos ou externos específicos.
O comando abaixo cria uma VM de TPU v5e com oito chips de TPU:
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Descrições de flags de comando
zone- A zona em que você cria a Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você cria. Para mais informações sobre os tipos de aceleradores disponíveis em cada versão de TPU, consulte Versões de TPU.
version- A versão do software de TPU.
Console
Estas instruções criam uma VM de TPU v5e com oito chips de TPU:
No console do Google Cloud , acesse a página TPUs:
Clique em Criar TPU.
No campo Nome, insira um nome para a TPU.
No campo Zona, selecione a zona em que você cria a TPU.
No campo Tipo de TPU, selecione um tipo de acelerador. O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você cria. Para mais informações sobre os tipos de acelerador aceitos em cada versão de TPU, consulte Versões de TPU.
No campo Versão do software de TPU, selecione uma versão. Ao criar uma VM do Cloud TPU, a versão do software de TPU especifica a versão do ambiente de execução de TPU que será instalada. Para mais informações, consulte Versões do software de TPU.
Clique em Criar para criar os recursos.
curl
O comando a seguir usa curl para criar uma VM de TPU v5e com oito chips de TPU.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Campos obrigatórios
runtime_version- A versão do ambiente de execução do Cloud TPU que você usa.
project-id- O nome do projeto do Google Cloud inscrito.
zone- A zona em que você cria o Cloud TPU.
node_name- O nome da VM de TPU que você vai criar.
Java
Este exemplo de código cria uma VM de TPU v5e com oito chips de TPU usando a API Cloud TPU em Java.
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Este exemplo de código cria uma VM de TPU v5e com oito chips de TPU usando a API Cloud TPU em Node.js.
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Este exemplo de código cria uma VM de TPU v5e com oito chips de TPU usando a API Cloud TPU em Python.
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Executar um script de inicialização
Para executar um script de inicialização na VM de TPU, especifique a flag
--metadata startup-script ao criar a VM.
gcloud
Esse comando cria uma VM de TPU e especifica um script de inicialização.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
Este exemplo de código cria uma VM da TPU e especifica um script de inicialização em Java.
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Este exemplo de código cria uma VM da TPU e especifica um script de inicialização em Node.js.
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Este exemplo de código cria uma VM da TPU e especifica um script de inicialização em Python.
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
A seguir
- Saiba mais sobre recursos em fila.
- Saiba como gerenciar VMs de TPU.
- Saiba mais sobre TPUs no GKE.
- Saiba como executar código JAX em uma VM de TPU.
- Saiba como executar o código do PyTorch em uma VM de TPU.
- Saiba como executar uma carga de trabalho de ML em TPUs, por exemplo, Disponibilizar o Qwen2-72B-Instruct com vLLM em TPUs.