Cotas do Cloud TPU

Este documento lista as cotas que se aplicam ao Cloud TPU. Para informações sobre preços do Cloud TPU, consulte Preços do Cloud TPU.

OGoogle Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe a alocação de um recurso doGoogle Cloud para uso do seu projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .

O sistema de cotas do Cloud faz o seguinte:

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.

As cotas geralmente se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.

Saiba mais em Visão geral das cotas do Cloud.

Cota de TPU

As cotas de TPU são limites quanto ao número de núcleos do Cloud TPU que podem ser usados com um projeto doGoogle Cloud . Cada versão de TPU está associada a uma cota própria. Além disso, a cota de cada versão do Cloud TPU é dividida em cota on demand e cota preemptiva (ou spot).

Ao criar recursos do Cloud TPU, você cria recursos on demand por padrão. É possível criar recursos preemptivos usando o parâmetro --spot ao criar recursos com o comando gcloud. Para mais informações, consulte Gerenciar recursos de TPU.

Cotas padrão do Cloud TPU

As tabelas a seguir mostram os valores padrão para a cota on demand e preemptiva em cada zona disponível. Esses valores especificam o número máximo de núcleos de TPU que podem ser usados no projeto.

Cotas preemptivas

Versão da TPU Cota padrão (número de núcleos) Nome da cota
v6e 1536 núcleos Núcleos de TPU v6e preemptiva por projeto e zona
v5p 768 núcleos Núcleos de TPU v5p preemptiva por projeto e zona
v5e 1536 núcleos Núcleos de pod da TPU v5 Lite preemptiva por projeto e zona
v4 0 núcleos Núcleos de pod da TPU v4 preemptiva por projeto e zona
Pod da v3 32 núcleos Núcleos de pod da TPU v3 preemptiva por projeto e zona
v3 120 núcleos Núcleos de TPU v3 preemptiva por projeto e zona
Pod da v2 32 núcleos Núcleos de pod da TPU v2 preemptiva por projeto e zona
v2 120 núcleos Núcleos de TPU v2 preemptiva por projeto e zona

Cotas on demand

Versão da TPU Cota padrão (número de núcleos) Nome da cota
v6e 512 núcleos Núcleos de TPU v6e por projeto e zona
v5p 128 núcleos Núcleos de TPU v5p por projeto e zona
v5e 512 núcleos Núcleos de pod da TPU v5 Lite por projeto e zona
v4 0 núcleos Núcleos de pod da TPU v4 por projeto e zona
Pod da v3 32 núcleos Núcleos de pod da TPU v3 por projeto e zona
v3 40 núcleos Núcleos de TPU v3 por projeto e zona
Pod da v2 32 núcleos Núcleos de pod da TPU v2 por projeto e zona
v2 40 núcleos Núcleos de TPU v2 por projeto e zona

Conferir e solicitar cota adicional

É possível conferir a cota alocada para o projeto do Google Cloud na página Cotas do console do Google Cloud .

É possível solicitar mais cota para o Cloud TPU na página Cotas. Encontre a cota que você quer aumentar, clique nos três pontos verticais e escolha Editar cota. Para saber mais, consulte Solicitar um ajuste de cota. Se você solicitar uma cota abaixo do limite de aprovação automática, a solicitação será aprovada automaticamente.

Cotas preemptivas

Versão da TPU Limite de aprovação automática Nome da cota
v6e Todas as zonas: 0 núcleos Núcleos de TPU v6e preemptiva por projeto e zona
v5p Todas as zonas: 0 núcleos Núcleos de TPU v5p preemptiva por projeto e zona
v5e
  • us-east5-b: 800 núcleos
  • us-west4-a: 1.600 núcleos
  • us-west4-b: 3.968 núcleos
  • us-west1-c: 576 núcleos
  • us-central1-a: 3.264 núcleos
  • europe-west4-a: 4.032 núcleos
Núcleos de pod da TPU v5 Lite preemptiva por projeto e zona
v4 Todas as zonas: 0 núcleos Núcleos de pod da TPU v4 preemptiva por projeto e zona
Pod da v3
  • europe-west4-a: 512 núcleos
  • us-east1-d: 320 núcleos
Núcleos de pod da TPU v3 preemptiva por projeto e zona
v3
  • us-central1-a: 64 núcleos
  • europe-west4-a: 128 núcleos
Núcleos de TPU v3 preemptiva por projeto e zona
Pod da v2
  • us-central1-a: 64 núcleos
  • europe-west4-a: 64 núcleos
Núcleos de pod da TPU v2 preemptiva por projeto e zona
v2
  • us-central1-b: 128 núcleos
  • us-central1-c: 64 núcleos
  • us-central1-f: 128 núcleos
  • europe-west4-a: 32 núcleos
Núcleos de TPU v2 preemptiva por projeto e zona

Cotas on demand

Versão da TPU Limite de aprovação automática Nome da cota
v6e Todas as zonas: 0 núcleos Núcleos de TPU v6e por projeto e zona
v5p us-east5-a: 64 núcleos Núcleos de TPU v5p por projeto e zona
v5e Todas as zonas: 64 núcleos Núcleos de pod da TPU v5 Lite por projeto e zona
v4 Todas as zonas: 0 núcleos Núcleos de pod da TPU v4 por projeto e zona
Pod da v3
  • europe-west4-a: 128 núcleos
  • us-east1-d: 64 núcleos
Núcleos de pod da TPU v3 por projeto e zona
v3
  • us-central1-a: 64 núcleos
  • europe-west4-a: 128 núcleos
Núcleos de TPU v3 por projeto e zona
Pod da v2
  • us-central1-a: 64 núcleos
  • europe-west4-a: 64 núcleos
Núcleos de pod da TPU v2 por projeto e zona
v2
  • us-central1-b: 128 núcleos
  • us-central1-c: 64 núcleos
  • us-central1-f: 128 núcleos
  • europe-west4-a: 32 núcleos
Núcleos de TPU v2 por projeto e zona

Você vai receber um e-mail informando se a solicitação de cota foi aprovada ou negada. Os aumentos de cota do serviçoGoogle Cloud acontecem gradualmente. Isso pode resultar em lançamentos que estejam em andamento em diferentes regiões ou recursos. Durante o lançamento, o valor de cota que aparece no console do Google Cloud ou na API Cloud Cotas não reflete o novo valor de cota aumentado até que o lançamento seja concluído. Para mais informações, consulte Conferir os lançamentos em andamento.