Neste documento, descrevemos como ajustar cotas usando o sistema do ajustador de cotas.
O ajustador de cotas observa seu consumo de recursos e envia solicitações de ajuste de cota em seu nome. Ao monitorar seu uso de recursos e enviar solicitações de ajuste de cota de modo proativo, ele ajuda a evitar interrupções causadas ao atingir o limite da cota. Ao usar o ajustador de cotas, você se preocupa menos com o monitoramento de aumentos não planejados no uso de recursos e envia menos solicitações manuais de ajustes de cota.
Como o ajustador de cotas funciona
Quando você ativa o ajustador de cotas, ele monitora todas as cotas aplicáveis e adota a seguinte lógica:
- O ajustador de cotas verifica se o pico de uso se aproximou do limite de cota durante um determinado período.
- Se isso aconteceu, ele tenta aumentar o limite de cota. Em geral, esse aumento é em torno de 10 a 20%.
Quando é possível aumentar o limite da cota, o aumento é aprovado e o valor ajustado. Você sempre pode solicitar manualmente aumentos de limite de cota, independentemente da ativação do ajustador de cotas.
O ajustador de cotas só envia solicitações de ajuste de cota para aumentar o limite de uma cota. Ele não tenta diminuir esse valor. No caso de cotas com um limite manual, o ajustador não envia solicitações de ajuste.
É possível conferir as solicitações feitas pelo ajustador de cotas na página Cotas e limites do sistema no console doGoogle Cloud . Também é possível configurar alertas para monitorar as mudanças iniciada pelo ajustador.
Limitações
O ajustador de cotas tem as seguintes limitações:
- As configurações do ajuste de cota no nível da pasta e da organização não estão disponíveis no console do Google Cloud . Para acessar as configurações do ajuste de cota no nível da pasta ou da organização, use a API Cloud Quotas (prévia) ou os comandos da Google Cloud CLI para Cloud Quotas (disponíveis no nível de lançamento
beta). - O ajuste de cotas não está disponível para todas as cotas. Para saber mais, consulte Disponibilidade neste documento.
Disponibilidade
A disponibilidade do ajustador de cotas depende do projeto do Google Cloud e só está disponível para algumas cotas do Google Cloud .
Qualificação com base no histórico de uso
O ajustador de cotas requer um volume suficiente de dados de uso históricos para determinar com precisão quando solicitar mais cotas. Por isso, a opção de ativar o ajustador de cotas só está disponível para projetos, pastas e organizações com atividade histórica suficiente para permitir previsões exatas.
Cotas aceitas
O ajustador de cotas não está disponível para todas as cotas doGoogle Cloud . Um serviço do Google Cloud pode aceitar o uso do ajustador de cotas para todas, algumas ou nenhuma das cotas. Se você ativar o ajustador de cotas em um projeto, ele será aplicado a todas as cotas aceitas.
Quando um serviço do Google Cloud adiciona ou expande o suporte ao ajustador para as próprias cotas, o ajustador monitora e ajusta automaticamente essas cotas que agora são aceitas para o projeto. Isso acontece mesmo quando essas cotas específicas não eram aceitas ao ativar inicialmente o ajustador de cotas.
A tabela a seguir lista as cotas aceitas pelo ajustador de cotas.
| Serviço | Cotas |
|---|---|
| API Artifact Registry | Solicitações por projeto na multirregião da Ásia por minuto |
| API Artifact Registry | Solicitações por projeto na multirregião da Europa por minuto |
| API Artifact Registry | Solicitações por projeto na multirregião dos EUA por minuto |
| API Artifact Registry | Solicitações por projeto, por região e por minuto |
| API Cloud Build | Solicitações GET de build e de operação por minuto |
| API Cloud Build | Solicitações GET de build e de operação por minuto e por usuário |
| API Cloud Build | CPUs de builds simultâneos (pool padrão regional) |
| API Cloud Build | Builds simultâneos (pool padrão não regional) |
| API Cloud Key Management Service | Solicitações de criptografia por minuto |
| API Cloud Key Management Service | Uso criptográfico do HSM |
| API Cloud Key Management Service | Solicitações de leitura por minuto |
| API Cloud Key Management Service | Ler uso |
| API Cloud Key Management Service | Uso de criptografia de software |
| API Cloud Key Management Service | Solicitações de gravação por minuto |
| API Cloud Key Management Service | Uso de gravação |
| API Cloud Logging | Bytes de gravação no registro por minuto e por região |
| API Cloud Monitoring | Solicitações de ingestão de séries temporais |
| API Cloud Monitoring | Consultas de série temporal |
| API Cloud Resource Manager | Solicitações de leitura por minuto |
| API Cloud Run Admin | Solicitações de execução de jobs por minuto e por região |
| API Cloud Run Admin | Solicitações de leitura por minuto e por região |
| API Cloud Run Admin | Alocação total de CPUs, em mili vCPU, por projeto e por região |
| API Cloud Run Admin | Solicitações de gravação por minuto e por região |
| API Cloud Trace | Solicitações de gravação (sem custos) por minuto |
| API Compute Engine | Grupos de afinidade |
| API Compute Engine | Buckets de back-end |
| API Compute Engine | CPUs C2 |
| API Compute Engine | CPUs C2D |
| API Compute Engine | CPUs C3 |
| API Compute Engine | Compromissos |
| API Compute Engine | CPUs A2 com compromisso de uso |
| API Compute Engine | CPUs com compromisso de uso |
| API Compute Engine | Licenças em uso |
| API Compute Engine | Disco SSD local reservado com compromisso de uso (GB) |
| API Compute Engine | CPUs M3 com compromisso de uso |
| API Compute Engine | CPUs com otimização de memória e compromisso de uso |
| API Compute Engine | CPUs N2 com compromisso de uso |
| API Compute Engine | CPUs N2D com compromisso de uso |
| API Compute Engine | CPUs T2D com compromisso de uso |
| API Compute Engine | CPUs |
| API Compute Engine | CPUs por família de VMs |
| API Compute Engine | Projetos do serviço de redes entre projetos |
| API Compute Engine | Serviços de back-end do balanceador de carga de rede de passagem externo |
| API Compute Engine | Regras de encaminhamento do balanceador de carga de rede de passagem externo |
| API Compute Engine | Regras de encaminhamento de protocolo externo |
| API Compute Engine | Gateways de VPN externos |
| API Compute Engine | Regras de firewall |
| API Compute Engine | Regras de encaminhamento |
| API Compute Engine | Serviços de back-end gerenciados externos globais |
| API Compute Engine | Buckets de back-end gerenciados internos globais |
| API Compute Engine | Serviços de back-end gerenciados internos globais |
| API Compute Engine | Políticas de SSL globais |
| API Compute Engine | Regras de encaminhamento gerenciadas externas globais |
| API Compute Engine | Serviços de back-end de balanceador de carga de proxy externo global |
| API Compute Engine | Serviços de back-end do Traffic Director interno global |
| API Compute Engine | Contagem de GPUs por família de GPUs |
| API Compute Engine | GPUs (todas as regiões) |
| API Compute Engine | Verificações de integridade |
| API Compute Engine | Imagens |
| API Compute Engine | Grupos de anexos de interconexão |
| API Compute Engine | Anexos de interconexão |
| API Compute Engine | Anexos de interconexão por interconexão |
| API Compute Engine | Total em Mbps dos anexos de interconexão |
| API Compute Engine | Grupos de interconexões |
| API Compute Engine | Interconexões |
| API Compute Engine | Endereços IP em uso |
| API Compute Engine | Endereços IPv4 externos regionais em uso |
| API Compute Engine | Programações de snapshots em uso |
| API Compute Engine | Grupos de instâncias |
| API Compute Engine | Modelos de instância |
| API Compute Engine | Instâncias por grupo de peering |
| API Compute Engine | Instâncias por rede VPC |
| API Compute Engine | Regras de encaminhamento interno por grupo de peering |
| API Compute Engine | Regras de encaminhamento de protocolo interno por rede VPC |
| API Compute Engine | Endereços IP internos |
| API Compute Engine | Serviços de back-end do balanceador de carga de rede de passagem interno |
| API Compute Engine | Regras de encaminhamento do balanceador de carga de rede de passagem interno por grupo de peering |
| API Compute Engine | Regras de encaminhamento do balanceador de carga de rede de passagem interno por rede VPC |
| API Compute Engine | Aliases de IP por grupo de peering |
| API Compute Engine | Alias de IP por rede VPC |
| API Compute Engine | Disco SSD local por família de VMs (GB) |
| API Compute Engine | CPUs M1 |
| API Compute Engine | CPUs M2 |
| API Compute Engine | CPUs M3 |
| API Compute Engine | Grupos gerenciados de instâncias |
| API Compute Engine | CPUs N2 |
| API Compute Engine | CPUs N2D |
| API Compute Engine | Anexos de rede |
| API Compute Engine | Grupos de endpoints de rede |
| API Compute Engine | Políticas de firewall de rede |
| API Compute Engine | Políticas de segurança de balanceamento de carga de rede |
| API Compute Engine | Regras da política de segurança de balanceamento de carga de rede |
| API Compute Engine | Atributos de regra da política de segurança de balanceamento de carga de rede |
| API Compute Engine | Redes |
| API Compute Engine | CPUs NVIDIA A2 |
| API Compute Engine | Espelhamentos de pacotes |
| API Compute Engine | IOPS do Persistent Disk |
| API Compute Engine | SSD do Persistent Disk (GB) |
| API Compute Engine | Persistent Disk padrão (GB) |
| API Compute Engine | CPUs preemptivas |
| API Compute Engine | SSD local preemptivo (GB) |
| API Compute Engine | GPUs NVIDIA A100 preemptivas de 80 GB |
| API Compute Engine | GPUs NVIDIA A100 preemptivas |
| API Compute Engine | GPUs NVIDIA H100 preemptivas |
| API Compute Engine | GPUs NVIDIA H100 MEGA preemptivas |
| API Compute Engine | GPUs NVIDIA K80 preemptivas |
| API Compute Engine | GPUs NVIDIA L4 preemptivas |
| API Compute Engine | GPUs NVIDIA L4 preemptivas para estações de trabalho virtuais |
| API Compute Engine | GPUs NVIDIA P100 preemptivas |
| API Compute Engine | GPUs NVIDIA P100 preemptivas para estações de trabalho virtuais |
| API Compute Engine | GPUs NVIDIA P4 preemptivas |
| API Compute Engine | GPUs NVIDIA P4 preemptivas para estações de trabalho virtuais |
| API Compute Engine | GPUs NVIDIA T4 preemptivas |
| API Compute Engine | GPUs NVIDIA T4 preemptivas para estações de trabalho virtuais |
| API Compute Engine | GPUs NVIDIA V100 preemptivas |
| API Compute Engine | Prefixos públicos anunciados |
| API Compute Engine | Regras de encaminhamento de consumidor do ILB de PSC por rede VPC do produtor |
| API Compute Engine | Regras de encaminhamento do balanceador de carga interno de PSC |
| API Compute Engine | Serviços de back-end gerenciados externos regionais |
| API Compute Engine | Regras de encaminhamento gerenciadas externas regionais por região e por rede VPC |
| API Compute Engine | Modelos de instâncias regionais |
| API Compute Engine | Regras de encaminhamento do balanceador de carga gerenciado interno regional por região e por rede VPC |
| API Compute Engine | Serviços de back-end gerenciados internos regionais |
| API Compute Engine | Serviços de back-end do Traffic Director interno regional |
| API Compute Engine | Grupos gerenciados de instâncias regionais |
| API Compute Engine | Políticas regionais de firewall da rede |
| API Compute Engine | Políticas de segurança regionais |
| API Compute Engine | Regras de política de segurança regionais |
| API Compute Engine | Regras de política de segurança regional com uma condição de correspondência avançada |
| API Compute Engine | Políticas de SSL regional |
| API Compute Engine | Proxies TCP de destino regionais |
| API Compute Engine | Roteadores |
| API Compute Engine | Atributos de regra por política de firewall de rede global |
| API Compute Engine | Atributos de regra por política de firewall de rede regional |
| API Compute Engine | Políticas de segurança |
| API Compute Engine | Regras da política de segurança |
| API Compute Engine | Regras de linguagem das regras da política de segurança |
| API Compute Engine | Anexos de serviço |
| API Compute Engine | Snapshots |
| API Compute Engine | Certificados SSL |
| API Compute Engine | Endereços IP BYOIP estáticos |
| API Compute Engine | Endereços IP estáticos |
| API Compute Engine | Endereços IPv4 internos globais estáticos |
| API Compute Engine | Intervalos de sub-redes por grupo de peering |
| API Compute Engine | Intervalos de sub-redes por rede VPC |
| API Compute Engine | CPUs T2A |
| API Compute Engine | CPUs T2D |
| API Compute Engine | Proxies HTTP de destino |
| API Compute Engine | Proxies HTTPS de destino |
| API Compute Engine | Proxies SSL de destino |
| API Compute Engine | Proxies TCP de destino |
| API Compute Engine | Instâncias de destino |
| API Compute Engine | Pools de destino |
| API Compute Engine | Gateways VPN de destino |
| API Compute Engine | Total do disco SSD local reservado (GB) |
| API Compute Engine | Regras de encaminhamento do Traffic Director |
| API Compute Engine | Prefixos de rota dinâmica do Cloud Router exclusivos de outras regiões para cada região por rede VPC |
| API Compute Engine | Prefixos de rota dinâmica do Cloud Router exclusivos da própria região para cada região por rede VPC |
| API Compute Engine | Mapas de URL |
| API Compute Engine | Instâncias de VM |
| API Compute Engine | Gateways VPN |
| API Compute Engine | Túneis VPN |
| API Connect Gateway | Solicitações de conexão de gateway por minuto |
| API Dialogflow | Todas as outras solicitações por minuto |
| API Filestore | Backups por região |
| API Filestore | Capacidade do HDD básico (padrão) por região (GB) |
| API Filestore | Capacidade do SSD básico (Premium) por região (GB) |
| API Filestore | Capacidade zonal e regional de 1 a 10 TiB (Enterprise) por região (GB) |
| API Filestore | Capacidade zonal e regional de 10 a 100 TiB (alta escala) por região (GB) |
| API Memorystore for Redis doGoogle Cloud | Capacidade total do Redis por região (GB) |
| API Memorystore for Redis doGoogle Cloud | Total de unidades do cluster do Redis por projeto e por região |
| API Google Sheets | Solicitações de leitura por minuto por projeto |
| API Google Sheets | Solicitações de leitura por minuto por usuário |
| API Google Sheets | Solicitações de gravação por minuto e por projeto |
| API Google Sheets | Solicitações de gravação por minuto e por usuário |
| API Memorystore | Total de unidades do Memorystore por projeto e por região |
| Remote Build Execution | Número de CPUs N2 reservadas (por região) |
| API Transcoder | Contagem de jobs simultâneos em lote |
| API Transcoder | Contagem de jobs pendentes em lote |
| API Transcoder | Contagem de jobs simultâneos |
| API Transcoder | Contagem de jobs de dublagem |
| API Transcoder | Receber solicitações |
| API Transcoder | Solicitações de lista |
| API Transcoder | Solicitações de mutação |
| API Vertex AI | CPUs personalizadas de disponibilização de modelos por região |
| API Vertex AI | GPUs NVIDIA T4 personalizadas de disponibilização de modelos por região |
| API Vertex AI | GPUs NVIDIA T4 personalizadas de treinamento de modelos por região |
| API Vertex AI | Solicitações de geração de conteúdo por minuto, por projeto e por modelo de base |
| API Vertex AI | Solicitações regionais de previsão on-line por minuto, por projeto e por modelo de base Observação: para conferir a lista completa de dimensões disponíveis, expanda esta entrada no console do Google Cloud . |
| API Vertex AI | Solicitações de gerenciamento de recursos (CRUD) por minuto e por região |
| API Vertex AI | Núcleos de pod TPU V3 de treinamento de imagens restritos por região |
Ativar o ajustador de cotas
Para ativar o ajustador de cotas, é necessário ter as seguintes permissões do Identity and Access Management:
cloudquotas.quotas.updatecloudquotas.quotas.get
Para ativar o ajustador de cotas, selecione a guia apropriada e siga as instruções:
Console
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Configurações.
- Clique no botão para Ativar.
Quando a coluna Status mostrar Ativado, o ajustador de cotas vai monitorar seu uso de recursos e emitir solicitações de ajuste de cota quando esse uso se aproximar do limite.
Para ativar o ajuste de cota por pasta ou organização, use a API REST ou a CLI gcloud.
REST
Faça uma solicitação HTTP para atualizar as configurações do ajustador de cotas:
PATCH https://cloudquotas.googleapis.com/v1beta/RESOURCE_CONTAINER/ID/locations/global/quotaAdjusterSettingsNo corpo da solicitação, especifique o contêiner de recursos de configurações do ajustador de cotas e defina o campo
enablementcomoENABLED. Também é possível especificar uma ETag, mas isso é opcional:{ name: RESOURCE_CONTAINER/ID/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }Substitua:
RESOURCE_CONTAINER: o tipo de contêiner de recursos:projects,foldersouorganizations.ID: o ID ou número do projeto, pasta ou organização em que você quer ativar o ajustador de cotas.OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cotas.
Isso atualiza o status de ativação para
enabled.
gcloud
Faça a autenticação usando a gcloud CLI:
gcloud auth loginPara ativar as configurações do ajustador de cotas, use o comando
gcloud beta quotas adjuster settings update.Ativar o ajustador de cotas em um projeto
Para especificar um projeto, use a flag
--project:gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabledSubstitua
PROJECT_ID_OR_NUMBERpelo ID do projeto ou número do projeto em que você quer ativar o ajustador de cotas.Ativar o ajustador de cotas em uma pasta
Para especificar uma pasta, use a flag
--folder:gcloud beta quotas adjuster settings update --folder=FOLDER_ID --enablement=enabledSubstitua
FOLDER_IDpelo ID da pasta em que você quer ativar o ajustador de cotas.Ativar o ajustador de cotas em uma organização
Para especificar uma organização, use a flag
--organization:gcloud beta quotas adjuster settings update --organization=ORGANIZATION_ID --enablement=enabledSubstitua
ORGANIZATION_IDpelo ID da organização em que você quer ativar o ajustador de cotas.Verifique o status de ativação:
gcloud beta quotas adjuster settings describe --RESOURCE_CONTAINER_TYPE=IDSubstitua:
RESOURCE_CONTAINER_TYPE: o tipo de contêiner de recursos:project,folderouorganization.ID: o ID do projeto, da pasta ou da organização para que você quer ver o status de ativação.
Se você tiver as permissões necessárias, o status será retornado como
enabled.
Conferir solicitações de ajuste de cota
Para conferir as solicitações de ajuste de cota, você precisa das seguintes permissões do IAM:
resourcemanager.projects.getserviceusage.services.listserviceusage.quotas.get
Para conferir as solicitações de ajuste de cota emitidas pelo ajustador de cotas, faça o seguinte:
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Solicitações de aumento. A visualização Solicitações de aumento mostra as solicitações de aumento do projeto, incluindo aumentos solicitados manualmente e solicitações emitidas pelo ajustador de cotas.
- Clique no campo Filtro.
- Selecione Tipo no menu e digite
Auto. Com isso, será possível filtrar as solicitações feitas pelo ajustador de cotas.
Configurar alertas do ajustador de cotas
Para receber alertas do ajustador de cotas, faça o seguinte:
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Configurações.
- Clique em Criar alerta.
- Selecione um dos modelos de alerta ou ambos:
- A opção Todos os ajustes feitos pelo ajustador de cotas envia um alerta sempre que o ajustador emite uma solicitação de ajuste de cotas para o projeto.
- A opção Erros e falhas do ajustador de cotas envia alertas somente quando o ajustador tenta aumentar um limite de cota e não consegue.
- Opcional: clique em Mostrar opções para ajustar os valores padrão de tempo mínimo entre alertas e a duração até o encerramento automático do incidente.
- Selecione Canal de notificação para receber alertas. Para ajustar as configurações do canal de notificação ou criar um canal, clique em Gerenciar canais de notificação.
- Clique em Criar.
Editar ou excluir alertas do ajustador de cotas
É possível editar ou excluir os alertas do ajustador de cotas no console doGoogle Cloud :
Acesse a página Políticas no console do Cloud Monitoring.
Pesquise a política de alertas do ajustador de cotas. Essas políticas têm os seguintes nomes:
Quota adjuster errors and failuresAll adjustments by quota adjuster
Na linha que mostra a política de alertas do ajustador de cotas, clique em Ver mais.
Clique em Editar ou em Excluir.
Desativar o ajustador de cotas
Para desativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:
cloudquotas.quotas.updatecloudquotas.quotas.get
Para desativar o ajustador de cotas, selecione a guia apropriada e siga as instruções:
Console
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Configurações.
- Clique no botão para Ativar. O botão fica cinza.
Quando o botão fica cinza e a coluna de status mostra Não ativado, o ajustador de cotas não monitora mais o uso nem emite solicitações de ajuste de cota.
Para desativar o ajuste de cota por pasta ou organização, use a API REST ou a CLI gcloud.
REST
Faça uma solicitação HTTP para atualizar as configurações do ajustador de cotas:
PATCH https://cloudquotas.googleapis.com/v1beta/RESOURCE_CONTAINER/ID/locations/global/quotaAdjusterSettingsNo corpo da solicitação, especifique o contêiner de recursos de configurações do ajustador de cotas e defina o campo
enablementcomoDISABLED. Também é possível especificar uma ETag, mas isso é opcional:{ name: RESOURCE_CONTAINER/ID/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }Substitua:
RESOURCE_CONTAINER: o tipo de contêiner de recursos:projects,foldersouorganizations.ID: o ID ou número do projeto, da pasta ou da organização em que você quer desativar o ajustador de cotas.OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cotas.
Isso atualiza o status de ativação para
disabled.
gcloud
Autentique-se na gcloud CLI:
gcloud auth loginPara desativar as configurações do ajustador de cotas, use o comando
gcloud beta quotas adjuster settings update.Desativar o ajustador de cotas em um projeto
Para especificar um projeto, use a flag
--project:gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabledSubstitua
PROJECT_ID_OR_NUMBERpelo ID do projeto ou número do projeto em que você quer desativar o ajustador de cotas.Desativar o ajustador de cotas em uma pasta
Para especificar uma pasta, use a flag
--folder:gcloud beta quotas adjuster settings update --folder=FOLDER_ID --enablement=disabledSubstitua
FOLDER_IDpelo ID da pasta em que você quer desativar o ajustador de cotas.Desativar o ajustador de cotas em uma organização
Para especificar uma organização, use a flag
--organization:gcloud beta quotas adjuster settings update --organization=ORGANIZATION_ID --enablement=disabledSubstitua
ORGANIZATION_IDpelo ID da organização em que você quer desativar o ajustador de cotas.Verifique o status de ativação:
gcloud beta quotas adjuster settings describe --RESOURCE_CONTAINER_TYPE=IDSubstitua:
RESOURCE_CONTAINER_TYPE: o tipo de contêiner de recursos:project,folderouorganization.ID: o ID do projeto, da pasta ou da organização para que você quer ver o status de ativação.
Se você tiver as permissões necessárias, o status será retornado como
disabled.
Resolver problemas de negação do aumento de cota
É possível que um aumento de cota iniciado pelo ajustador seja negado. Às vezes, isso ocorre quando o Google Cloud não consegue aumentar o limite de cota em um projeto, recurso ou região além de um determinado valor. Nesses casos, ainda é possível solicitar um aumento manual de cota.
Para receber notificações quando uma solicitação de ajuste de cota feita pelo ajustador for negada, configure os alertas do ajustador de cotas.