Gerenciar recursos em fila
Com os recursos em fila, é possível solicitar recursos do Cloud TPU de maneira enfileirada. A solicitação de recursos em fila que você faz é adicionada a uma fila que é mantida pelo serviço Cloud TPU. Quando o recurso solicitado fica disponível, ele é atribuído ao projeto do Google Cloud para uso exclusivo e imediato. Ele vai permanecer atribuído ao seu projeto, a menos que seja excluído ou interrompido. Somente VMs spot de TPU e TPUs preemptivas estão qualificadas para a preempção.
É possível especificar horários de início e término opcionais para uma solicitação de recurso em fila. O horário de início especifica o primeiro horário em que a solicitação pode ser atendida. Se uma solicitação não é atendida até o horário de término especificado, ela expira. A solicitação permanece na fila depois de expirar.
As solicitações de recursos em fila podem estar em um dos seguintes estados:
WAITING_FOR_RESOURCES- A solicitação passou pela validação inicial e foi adicionada à fila. Ela permanece nesse estado até que haja recursos livres suficientes para iniciar o provisionamento da solicitação ou o intervalo de alocação expire. Quando a demanda é alta, nem todas as solicitações podem ser provisionadas imediatamente. Se você precisar de uma disponibilidade de TPUs mais confiável, considere comprar uma reserva.
PROVISIONING- A solicitação foi selecionada na fila e os recursos estão sendo alocados.
ACTIVE- A solicitação foi alocada. Quando as solicitações de recursos em fila estão no estado
ACTIVE, é possível gerenciar as VMs de TPU conforme descrito em Gerenciar TPUs. FAILED- Não foi possível concluir a solicitação porque há um problema com ela ou os recursos solicitados não estavam disponíveis no intervalo de alocação. A solicitação permanece na fila até ser excluída explicitamente.
SUSPENDING- Os recursos associados à solicitação estão sendo excluídos.
SUSPENDED- Os recursos especificados na solicitação foram excluídos. Quando uma solicitação
está no estado
SUSPENDED, ela não se qualifica mais para alocação adicional.
Pré-requisitos
Antes de executar os comandos neste guia, instale a CLI do Google Cloud, crie um projeto do Google Cloud e ative a API Cloud TPU. Para instruções, consulte Configurar o ambiente do Cloud TPU.
Se você estiver usando uma das bibliotecas de cliente do Cloud, siga as instruções de configuração para a linguagem em uso:
Solicitar um recurso em fila on demand
Os recursos on demand não serão interrompidos, mas a cota on demand não garante que haverá recursos suficientes do Cloud TPU disponíveis para atender à solicitação. Para mais informações sobre recursos on demand, consulte Tipos de cota.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite
Descrições dos parâmetros de comando
queued-resource-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID atribuído pelo usuário da TPU, que é criado quando a solicitação de recurso em fila é alocada.
project- Seu projeto do Google Cloud .
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID atribuído pelo usuário da TPU, que é criado quando a solicitação de recurso em fila é alocada.
project- Seu projeto do Google Cloud .
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
Console
No console do Google Cloud , acesse a página TPUs:
Clique em Criar TPU.
No campo Nome, insira um nome para a TPU.
Na caixa Zona, selecione a zona em que você quer criar a TPU.
Na caixa Tipo de TPU, selecione um tipo de acelerador. O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de acelerador aceitos em cada versão de TPU, consulte Versões de TPU.
Na caixa Versão do software de TPU, selecione uma versão. Ao criar uma VM do Cloud TPU, a versão do software de TPU especifica a versão do ambiente de execução da TPU que será instalada. Para mais informações, consulte Versões do software de TPU.
Clique no botão Ativar enfileiramento.
No campo Nome do recurso em fila, digite um nome para a solicitação de recurso em fila.
Clique em Criar para criar a solicitação de recurso em fila.
Java
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Solicitar um recurso em fila usando uma reserva
É possível solicitar um recurso em fila usando uma reserva. Para comprar uma reserva, entre em contato com a equipe de conta do Google Cloud .
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --reserved
Descrições dos parâmetros de comando
queued-resource-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID atribuído pelo usuário da TPU, que é criado quando a solicitação de recurso em fila é alocada.
project- Seu projeto do Google Cloud .
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
reserved- Use essa flag ao solicitar recursos em fila como parte de uma reserva do Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID atribuído pelo usuário da TPU, que é criado quando a solicitação de recurso em fila é alocada.
project- Seu projeto do Google Cloud .
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
reserved- Use essa flag ao solicitar recursos em fila como parte de uma reserva do Cloud TPU.
Console
No console do Google Cloud , acesse a página TPUs:
Clique em Criar TPU.
No campo Nome, insira um nome para a TPU.
Na caixa Zona, selecione a zona em que você quer criar a TPU.
Na caixa Tipo de TPU, selecione um tipo de acelerador. O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de acelerador aceitos em cada versão de TPU, consulte Versões de TPU.
Na caixa Versão do software de TPU, selecione uma versão. Ao criar uma VM do Cloud TPU, a versão do software de TPU especifica a versão do ambiente de execução da TPU que será instalada. Para mais informações, consulte Versões do software de TPU.
Clique no botão Ativar enfileiramento.
No campo Nome do recurso em fila, digite um nome para a solicitação de recurso em fila.
Expanda a seção Gerenciamento.
Marque a caixa de seleção Usar a reserva atual.
Clique em Criar para criar a solicitação de recurso em fila.
Solicitar um recurso em fila de VM spot de TPU
Uma VM spot é um recurso que pode ser interrompido e atribuído a outra carga de trabalho a qualquer momento. Os recursos de VM spot custam menos, e você pode ter acesso a eles mais cedo em comparação com uma solicitação de VM que não é spot. Para mais informações sobre VMs spot de TPU, consulte Gerenciar VMs spot de TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --spot
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
spot- Uma flag booleana que especifica que o recurso em fila é uma VM spot.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
spot- Uma flag booleana que especifica que o recurso em fila é uma VM spot.
Console
No console do Google Cloud , acesse a página TPUs:
Clique em Criar TPU.
No campo Nome, insira um nome para a TPU.
Na caixa Zona, selecione a zona em que você quer criar a TPU.
Na caixa Tipo de TPU, selecione um tipo de acelerador. O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de acelerador aceitos em cada versão de TPU, consulte Versões de TPU.
Na caixa Versão do software de TPU, selecione uma versão. Ao criar uma VM do Cloud TPU, a versão do software de TPU especifica a versão do ambiente de execução da TPU que será instalada. Para mais informações, consulte Versões do software de TPU.
Clique no botão Ativar enfileiramento.
No campo Nome do recurso em fila, digite um nome para a solicitação de recurso em fila.
Expanda a seção Gerenciamento.
Marque a caixa de seleção Transformar esta VM em uma VM spot de TPU.
Clique em Criar.
Java
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Solicitar que um recurso em fila seja alocado antes ou depois de um horário especificado
É possível especificar um horário de início ou de término opcional em uma solicitação de recurso em fila. O horário ou a duração de início especifica a partir de quando a solicitação pode ser atendida. O horário ou a duração de término especifica por quanto tempo a solicitação permanece válida. Se uma solicitação não é atendida até o horário de término especificado ou durante o período especificado, ela expira. Depois que a solicitação expira, ela permanece na fila, mas não está mais qualificada para alocação.
Também é possível especificar um intervalo de alocação definindo um horário ou duração de início e de término.
Para conferir uma lista de formatos de carimbo de data/hora e duração aceitos, consulte Data e hora.
Solicitar que um recurso em fila seja atendido após um período especificado
Em uma solicitação de recurso em fila, é possível especificar um horário ou período a partir do qual um recurso deve ser alocado.
gcloud
O comando a seguir solicita a alocação de uma TPU v5p-4096 após as 9h do dia 14 de dezembro de 2022.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-time 2022-12-14T09:00:00Z
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores disponíveis em cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-after-time- O horário a partir do qual o recurso pode ser alocado. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
curl
O comando a seguir solicita a alocação de uma TPU v5p-4096 após as 9h do dia 14 de dezembro de 2022.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-after-time- O horário a partir do qual o recurso pode ser alocado. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
Console
No console do Google Cloud , acesse a página TPUs:
Clique em Criar TPU.
No campo Nome, insira um nome para a TPU.
Na caixa Zona, selecione a zona em que você quer criar a TPU.
Na caixa Tipo de TPU, selecione um tipo de acelerador. O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de acelerador aceitos em cada versão de TPU, consulte Versões de TPU.
Na caixa Versão do software de TPU, selecione uma versão. Ao criar uma VM do Cloud TPU, a versão do software de TPU especifica a versão do ambiente de execução da TPU que será instalada. Para mais informações, consulte Versões do software de TPU.
Clique no botão Ativar enfileiramento.
No campo Nome do recurso em fila, digite um nome para a solicitação de recurso em fila.
No campo Iniciar solicitação em, insira o horário a partir do qual o recurso pode ser alocado.
Clique em Criar para criar a solicitação de recurso em fila.
O exemplo a seguir solicita que uma v5p-32 seja alocada após seis horas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 6h
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-after-duration- O período durante o qual a TPU não pode ser provisionada. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-after-duration- O período durante o qual a TPU não pode ser provisionada. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud
Java
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Solicitar um recurso em fila que expira após um período especificado
Em uma solicitação de recurso em fila, é possível especificar por quanto tempo ela permanece válida. Se a solicitação não é atendida até o horário ou período especificado, ela expira.
gcloud
O comando a seguir solicita uma TPU v5p-4096. Se a solicitação não for atendida até 14 de dezembro de 2022 às 9h, ela vai expirar.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-time 2022-12-14T09:00:00Z
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores disponíveis em cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-until-time- O horário após o qual a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
curl
O comando a seguir solicita uma TPU v5p-4096. Se a solicitação não for atendida até 14 de dezembro de 2022 às 9h, ela vai expirar.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores disponíveis em cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-until-time- O horário após o qual a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
Console
No console do Google Cloud , acesse a página TPUs:
Clique em Criar TPU.
No campo Nome, insira um nome para a TPU.
Na caixa Zona, selecione a zona em que você quer criar a TPU.
Na caixa Tipo de TPU, selecione um tipo de acelerador. O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de acelerador aceitos em cada versão de TPU, consulte Versões de TPU.
Na caixa Versão do software de TPU, selecione uma versão. Ao criar uma VM do Cloud TPU, a versão do software de TPU especifica a versão do ambiente de execução da TPU que será instalada. Para mais informações, consulte Versões do software de TPU.
Clique no botão Ativar enfileiramento.
No campo Nome do recurso em fila, digite um nome para a solicitação de recurso em fila.
No campo Cancelar solicitação em, insira o horário em que a solicitação de recurso em fila deve expirar se não for atendida.
Clique em Criar para criar a solicitação de recurso em fila.
O exemplo a seguir solicita uma v5p-32. A solicitação vai expirar se não for atendida em seis horas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-duration 6h
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-until-duration- A duração da validade da solicitação. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-until-duration- A duração da validade da solicitação. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud
Python
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Solicitar que um recurso em fila seja alocado em um intervalo especificado
É possível especificar um intervalo de alocação informando o horário ou a duração de início e o horário ou a duração de término.
gcloud
O comando a seguir solicita uma v5p-32 em cinco horas e 30 minutos a partir do horário atual, e ela deve ser criada até 14 de dezembro de 2022 às 9h.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
Descrições de flags de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-until-time- O horário após o qual a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
valid-after-duration- O período durante o qual a TPU não pode ser provisionada. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
curl
O comando a seguir solicita uma v5p-32 em cinco horas e 30 minutos a partir do horário atual, e ela deve ser criada até 14 de dezembro de 2022 às 9h.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de flags de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
valid-until-timw- O horário após o qual a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
valid-until-duration- A duração da validade da solicitação. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
Console
No console do Google Cloud , acesse a página TPUs:
Clique em Criar TPU.
No campo Nome, insira um nome para a TPU.
Na caixa Zona, selecione a zona em que você quer criar a TPU.
Na caixa Tipo de TPU, selecione um tipo de acelerador. O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de acelerador aceitos em cada versão de TPU, consulte Versões de TPU.
Na caixa Versão do software de TPU, selecione uma versão. Ao criar uma VM do Cloud TPU, a versão do software de TPU especifica a versão do ambiente de execução da TPU que será instalada. Para mais informações, consulte Versões do software de TPU.
Clique no botão Ativar enfileiramento.
No campo Nome do recurso em fila, digite um nome para a solicitação de recurso em fila.
No campo Iniciar solicitação em, insira o horário a partir do qual o recurso pode ser alocado.
No campo Cancelar solicitação em, insira o horário em que a solicitação de recurso em fila deve expirar se não for atendida.
Clique em Criar para criar a solicitação de recurso em fila.
Solicitar um recurso em fila com um script de inicialização
É possível especificar um script para ser executado em um recurso em fila depois do provisionamento.
gcloud
Ao usar o comando gcloud, é possível inserir a flag --metadata ou --metadata-from-file
para especificar um comando de script ou um arquivo que
contém o código do script, respectivamente. O exemplo a seguir cria uma
solicitação de recurso em fila que vai executar o script startup-script.sh.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --metadata-from-file='startup-script=startup-script.sh'
Descrições de flags de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores disponíveis em cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
validInterval- O período em que a solicitação permanece válida. Depois disso, ela é cancelada. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
metadata-from-file- Especifica um arquivo que contém metadados. Se você não especificar um caminho totalmente qualificado para o arquivo de metadados, o comando vai presumir que ele está no diretório atual. Neste exemplo, o arquivo contém um script de inicialização que é executado quando o recurso em fila é provisionado.
metadata- Especifica metadados para a solicitação. Neste exemplo, os metadados são um comando de script de inicialização que é executado quando o recurso em fila é provisionado.
curl
Ao usar curl, inclua o código do script no conteúdo JSON.
O exemplo a seguir inclui um script inline no corpo JSON.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central1-a', node_id: 'your-node-id', node: { accelerator_type: 'v5e-8', runtime_version: 'v2-alpha-tpuv5-lite', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de flags de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores disponíveis em cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
validInterval- O período em que a solicitação permanece válida. Depois disso, ela é cancelada. Para mais informações sobre formatos de duração, consulte o tópico sobre datas e horas da CLI do Google Cloud.
metadata-from-file- Especifica um arquivo que contém metadados. Se você não especificar um caminho totalmente qualificado para o arquivo de metadados, o comando vai presumir que ele está no diretório atual. Neste exemplo, o arquivo contém um script de inicialização que é executado quando o recurso em fila é provisionado.
metadata- Especifica metadados para a solicitação. Neste exemplo, os metadados são um comando de script de inicialização que é executado quando o recurso em fila é provisionado.
Java
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Solicitar um recurso em fila com uma rede e uma sub-rede especificadas
Em uma solicitação de recurso em fila, é possível especificar uma rede e uma sub-rede para conectar à TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5e-8 \ --runtime-version v2-alpha-tpuv5-lite \ --network network-name \ --subnetwork subnetwork-name
Descrições dos parâmetros de comando
queued-resource-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID atribuído pelo usuário da TPU, que é criado quando a solicitação de recurso em fila é alocada.
project- Seu projeto do Google Cloud .
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
reserved- Use essa flag ao solicitar recursos em fila como parte de uma reserva do Cloud TPU.
network- Uma rede de que o recurso em fila fará parte.
subnetwork- Uma sub-rede de que o recurso em fila fará parte.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5e-8', 'runtime_version': 'v2-alpha-tpuv5-lite', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Descrições dos parâmetros de comando
queued-resource-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
node-id- O ID atribuído pelo usuário da TPU, que é criado quando a solicitação de recurso em fila é alocada.
project- Seu projeto do Google Cloud .
zone- A zona em que você planeja criar o Cloud TPU.
accelerator-type- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores aceitos por cada versão de TPU, consulte Versões de TPU.
runtime-version- A versão do software do Cloud TPU.
reserved- Use essa flag ao solicitar recursos em fila como parte de uma reserva do Cloud TPU.
network- Uma rede de que o recurso em fila fará parte.
subnetwork- Uma sub-rede de que o recurso em fila fará parte.
Console
No console do Google Cloud , acesse a página TPUs:
Clique em Criar TPU.
No campo Nome, insira um nome para a TPU.
Na caixa Zona, selecione a zona em que você quer criar a TPU.
Na caixa Tipo de TPU, selecione um tipo de acelerador. O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de acelerador aceitos em cada versão de TPU, consulte Versões de TPU.
Na caixa Versão do software de TPU, selecione uma versão. Ao criar uma VM do Cloud TPU, a versão do software de TPU especifica a versão do ambiente de execução da TPU que será instalada. Para mais informações, consulte Versões do software de TPU.
Clique no botão Ativar enfileiramento.
No campo Nome do recurso em fila, digite um nome para a solicitação de recurso em fila.
Expanda a seção Rede.
Nos campos Rede e Sub-rede, selecione a rede e a sub-rede que você quer usar.
Clique em Criar para criar a solicitação de recurso em fila.
Java
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Excluir uma solicitação de recurso em fila
Para excluir uma solicitação de recurso em fila e a TPU associada, exclua a solicitação:
gcloud
Transmita a flag --force ao comando queued-resource delete:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a \ --force \ --async
Descrições de flags de comando
your-queued-resource-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona do Cloud TPU a ser excluída.
force- Exclua a VM de TPU e a solicitação de recurso em fila.
curl
Use o parâmetro de consulta force=true na solicitação curl:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id?force=true
Descrições de flags de comando
your-queued-resource-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona do Cloud TPU a ser excluída.
force- Exclua a VM de TPU e a solicitação de recurso em fila.
Console
No console do Google Cloud , acesse a página TPUs:
Clique na guia Recursos em fila.
Marque a caixa de seleção ao lado da solicitação de recurso em fila.
Clique em Excluir.
Java
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Se você excluir a TPU diretamente, também vai precisar excluir o recurso em fila, conforme
mostrado no exemplo a seguir. Quando você exclui a TPU, a solicitação de recurso em fila
passa para o estado SUSPENDED.
Depois disso, ela pode ser excluída.
gcloud
Exclua a TPU:
$ gcloud compute tpus tpu-vm delete your-node-id \ --project=your-project-id \ --zone=us-central1-a \ --quiet
Descrições de flags de comando
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona do Cloud TPU a ser excluída.
your-node-id- O nome da TPU que você quer excluir.
Quando você exclui a TPU, o recurso em fila associado passa para o estado
SUSPENDING e depois para SUSPENDED. Quando o recurso em fila
está no estado SUSPENDED, é possível excluí-lo:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a
Descrições de flags de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona do Cloud TPU a ser excluída.
curl
Exclua a TPU:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project/locations/us-central1-a/nodes?node_id=your-node-id
Descrições de flags de comando
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona do Cloud TPU a ser excluída.
your-node-id- O nome da TPU que você quer excluir.
Quando você exclui a TPU, o recurso em fila associado passa para o estado
SUSPENDING e depois para SUSPENDED. Quando o recurso em fila
está no estado SUSPENDED, é possível excluí-lo:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
Descrições de flags de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona do Cloud TPU a ser excluída.
Console
Exclua a TPU:
No console do Google Cloud , acesse a página TPUs:
Marque a caixa de seleção ao lado da TPU.
Clique em Excluir.
Quando você exclui a TPU, o recurso em fila associado passa para o estado Suspendendo e depois para Suspenso. Quando o recurso em fila está no estado Suspenso, é possível excluí-lo:
- Clique na guia Recursos em fila.
- Marque a caixa de seleção ao lado da solicitação de recurso em fila.
- Clique em Excluir.
Java
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Quando você exclui a TPU, o recurso em fila associado passa para o estado
SUSPENDING e depois para SUSPENDED. Quando o recurso em fila está
no estado SUSPENDED, é possível excluí-lo:
Python
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Quando você exclui a TPU, o recurso em fila associado passa para o estado
SUSPENDING e depois para SUSPENDED. Quando o recurso em fila está
no estado SUSPENDED, é possível excluí-lo:
Recuperar informações de estado e diagnóstico sobre uma solicitação de recurso em fila
Recupere informações de estado e diagnóstico sobre uma solicitação de recurso em fila:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central1-a
Descrições de flags de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
Descrições de flags de comando
queued-resource-request-id- O ID atribuído pelo usuário da solicitação de recurso em fila.
project- O ID do projeto em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
Console
No console do Google Cloud , acesse a página TPUs:
Clique na guia Recursos em fila.
Clique no nome da solicitação de recurso em fila.
Depois que a TPU for provisionada, você também poderá conferir detalhes sobre a solicitação de recurso em fila. Para isso, acesse a página TPUs, encontre sua TPU e clique no nome da solicitação de recurso em fila correspondente.
Java
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Se a solicitação falhar, a saída vai conter informações sobre o erro. A saída de uma solicitação que está aguardando recursos será parecida com esta:
gcloud
name: projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central1-a/queuedResources/your-queued-resource-id runtimeVersion: v2-alpha-tpuv5-lite schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central1-a
Console
O campo Status do recurso em fila mostra Aguardando recursos.
Listar solicitações de recursos em fila no projeto
Liste as solicitações de recursos em fila no projeto:
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central1-a
Descrições de flags de comando
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/your-zone/queuedResources
Descrições de flags de comando
project- O projeto do Google Cloud em que o recurso em fila está alocado.
zone- A zona em que você planeja criar o Cloud TPU.
Console
No console do Google Cloud , acesse a página TPUs:
Clique na guia Recursos em fila.
Java
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para autenticar-se no Cloud TPU, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.