Cotas do Cloud TPU
Este documento lista as cotas que se aplicam ao Cloud TPU. Para informações sobre preços do Cloud TPU, consulte Preços do Cloud TPU.
OGoogle Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe a alocação de um recurso doGoogle Cloud para uso do seu projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de produtos e serviços do Google Cloud .
- Restringe o consumo desses recursos.
- Possibilita a solicitação de mudanças no valor das cotas e a automatização de ajustes de cotas.
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Saiba mais em Visão geral das cotas do Cloud.Cota de TPU
As cotas de TPU são limites quanto ao número de núcleos do Cloud TPU que podem ser usados com um projeto doGoogle Cloud . Cada versão de TPU está associada a uma cota própria. Além disso, a cota de cada versão do Cloud TPU é dividida em cota on demand e cota preemptiva (ou spot).
Ao criar recursos do Cloud TPU, você cria
recursos on demand por padrão. É possível criar recursos preemptivos usando o parâmetro --spot
ao criar recursos com o comando gcloud. Para mais informações, consulte
Gerenciar recursos de TPU.
Cotas padrão do Cloud TPU
As tabelas a seguir mostram os valores padrão para a cota on demand e preemptiva em cada zona disponível. Esses valores especificam o número máximo de núcleos de TPU que podem ser usados no projeto.
Cotas preemptivas
| Versão da TPU | Cota padrão (número de núcleos) | Nome da cota |
|---|---|---|
| v6e | 1536 núcleos | Núcleos de TPU v6e preemptiva por projeto e zona |
| v5p | 768 núcleos | Núcleos de TPU v5p preemptiva por projeto e zona |
| v5e | 1536 núcleos | Núcleos de pod da TPU v5 Lite preemptiva por projeto e zona |
| v4 | 0 núcleos | Núcleos de pod da TPU v4 preemptiva por projeto e zona |
| Pod da v3 | 32 núcleos | Núcleos de pod da TPU v3 preemptiva por projeto e zona |
| v3 | 120 núcleos | Núcleos de TPU v3 preemptiva por projeto e zona |
| Pod da v2 | 32 núcleos | Núcleos de pod da TPU v2 preemptiva por projeto e zona |
| v2 | 120 núcleos | Núcleos de TPU v2 preemptiva por projeto e zona |
Cotas on demand
| Versão da TPU | Cota padrão (número de núcleos) | Nome da cota |
|---|---|---|
| v6e | 512 núcleos | Núcleos de TPU v6e por projeto e zona |
| v5p | 128 núcleos | Núcleos de TPU v5p por projeto e zona |
| v5e | 512 núcleos | Núcleos de pod da TPU v5 Lite por projeto e zona |
| v4 | 0 núcleos | Núcleos de pod da TPU v4 por projeto e zona |
| Pod da v3 | 32 núcleos | Núcleos de pod da TPU v3 por projeto e zona |
| v3 | 40 núcleos | Núcleos de TPU v3 por projeto e zona |
| Pod da v2 | 32 núcleos | Núcleos de pod da TPU v2 por projeto e zona |
| v2 | 40 núcleos | Núcleos de TPU v2 por projeto e zona |
Conferir e solicitar cota adicional
É possível conferir a cota alocada para o projeto do Google Cloud na página Cotas do console do Google Cloud .
É possível solicitar mais cota para o Cloud TPU na página Cotas. Encontre a cota que você quer aumentar, clique nos três pontos verticais e escolha Editar cota. Para saber mais, consulte Solicitar um ajuste de cota. Se você solicitar uma cota abaixo do limite de aprovação automática, a solicitação será aprovada automaticamente.
Cotas preemptivas
| Versão da TPU | Limite de aprovação automática | Nome da cota |
|---|---|---|
| v6e | Todas as zonas: 0 núcleos | Núcleos de TPU v6e preemptiva por projeto e zona |
| v5p | Todas as zonas: 0 núcleos | Núcleos de TPU v5p preemptiva por projeto e zona |
| v5e |
|
Núcleos de pod da TPU v5 Lite preemptiva por projeto e zona |
| v4 | Todas as zonas: 0 núcleos | Núcleos de pod da TPU v4 preemptiva por projeto e zona |
| Pod da v3 |
|
Núcleos de pod da TPU v3 preemptiva por projeto e zona |
| v3 |
|
Núcleos de TPU v3 preemptiva por projeto e zona |
| Pod da v2 |
|
Núcleos de pod da TPU v2 preemptiva por projeto e zona |
| v2 |
|
Núcleos de TPU v2 preemptiva por projeto e zona |
Cotas on demand
| Versão da TPU | Limite de aprovação automática | Nome da cota |
|---|---|---|
| v6e | Todas as zonas: 0 núcleos | Núcleos de TPU v6e por projeto e zona |
| v5p | us-east5-a: 64 núcleos | Núcleos de TPU v5p por projeto e zona |
| v5e | Todas as zonas: 64 núcleos | Núcleos de pod da TPU v5 Lite por projeto e zona |
| v4 | Todas as zonas: 0 núcleos | Núcleos de pod da TPU v4 por projeto e zona |
| Pod da v3 |
|
Núcleos de pod da TPU v3 por projeto e zona |
| v3 |
|
Núcleos de TPU v3 por projeto e zona |
| Pod da v2 |
|
Núcleos de pod da TPU v2 por projeto e zona |
| v2 |
|
Núcleos de TPU v2 por projeto e zona |
Você vai receber um e-mail informando se a solicitação de cota foi aprovada ou negada. Os aumentos de cota do serviçoGoogle Cloud acontecem gradualmente. Isso pode resultar em lançamentos que estejam em andamento em diferentes regiões ou recursos. Durante o lançamento, o valor de cota que aparece no console do Google Cloud ou na API Cloud Cotas não reflete o novo valor de cota aumentado até que o lançamento seja concluído. Para mais informações, consulte Conferir os lançamentos em andamento.