Usar o ajustador de cotas

Neste documento, descrevemos como ajustar cotas usando o sistema do ajustador de cotas.

O ajustador de cotas observa seu consumo de recursos e envia solicitações de ajuste de cota em seu nome. Ao monitorar seu uso de recursos e enviar solicitações de ajuste de cota de modo proativo, ele ajuda a evitar interrupções causadas ao atingir o limite da cota. Ao usar o ajustador de cotas, você se preocupa menos com o monitoramento de aumentos não planejados no uso de recursos e envia menos solicitações manuais de ajustes de cota.

Como o ajustador de cotas funciona

Quando você ativa o ajustador de cotas, ele monitora todas as cotas aplicáveis e adota a seguinte lógica:

O ajustador de cotas verifica se o pico de uso se aproximou do limite de cota durante um determinado período.
Se isso aconteceu, ele tenta aumentar o limite de cota. Em geral, esse aumento é em torno de 10 a 20%.

Quando é possível aumentar o limite da cota, o aumento é aprovado e o valor ajustado. Você sempre pode solicitar manualmente aumentos de limite de cota, independentemente da ativação do ajustador de cotas.

O ajustador de cotas só envia solicitações de ajuste de cota para aumentar o limite de uma cota. Ele não tenta diminuir esse valor. No caso de cotas com um limite manual, o ajustador não envia solicitações de ajuste.

É possível conferir as solicitações feitas pelo ajustador de cotas na página Cotas e limites do sistema no console doGoogle Cloud . Também é possível configurar alertas para monitorar as mudanças iniciada pelo ajustador.

Limitações

O ajustador de cotas tem as seguintes limitações:

As configurações do ajuste de cota no nível da pasta e da organização não estão disponíveis no console do Google Cloud . Para acessar as configurações do ajuste de cota no nível da pasta ou da organização, use a API Cloud Quotas (prévia) ou os comandos da Google Cloud CLI para Cloud Quotas (disponíveis no nível de lançamento beta).
O ajuste de cotas não está disponível para todas as cotas. Para saber mais, consulte Disponibilidade neste documento.

Disponibilidade

A disponibilidade do ajustador de cotas depende do projeto do Google Cloud e só está disponível para algumas cotas do Google Cloud .

Qualificação com base no histórico de uso

O ajustador de cotas requer um volume suficiente de dados de uso históricos para determinar com precisão quando solicitar mais cotas. Por isso, a opção de ativar o ajustador de cotas só está disponível para projetos, pastas e organizações com atividade histórica suficiente para permitir previsões exatas.

Cotas aceitas

O ajustador de cotas não está disponível para todas as cotas doGoogle Cloud . Um serviço do Google Cloud pode aceitar o uso do ajustador de cotas para todas, algumas ou nenhuma das cotas. Se você ativar o ajustador de cotas em um projeto, ele será aplicado a todas as cotas aceitas.

Quando um serviço do Google Cloud adiciona ou expande o suporte ao ajustador para as próprias cotas, o ajustador monitora e ajusta automaticamente essas cotas que agora são aceitas para o projeto. Isso acontece mesmo quando essas cotas específicas não eram aceitas ao ativar inicialmente o ajustador de cotas.

A tabela a seguir lista as cotas aceitas pelo ajustador de cotas.

Serviço	Cotas
API Artifact Registry	Solicitações por projeto na multirregião da Ásia por minuto
API Artifact Registry	Solicitações por projeto na multirregião da Europa por minuto
API Artifact Registry	Solicitações por projeto na multirregião dos EUA por minuto
API Artifact Registry	Solicitações por projeto, por região e por minuto
API Cloud Build	Solicitações GET de build e de operação por minuto
API Cloud Build	Solicitações GET de build e de operação por minuto e por usuário
API Cloud Build	CPUs de builds simultâneos (pool padrão regional)
API Cloud Build	Builds simultâneos (pool padrão não regional)
API Cloud Key Management Service	Solicitações de criptografia por minuto
API Cloud Key Management Service	Uso criptográfico do HSM
API Cloud Key Management Service	Solicitações de leitura por minuto
API Cloud Key Management Service	Ler uso
API Cloud Key Management Service	Uso de criptografia de software
API Cloud Key Management Service	Solicitações de gravação por minuto
API Cloud Key Management Service	Uso de gravação
API Cloud Logging	Bytes de gravação no registro por minuto e por região
API Cloud Monitoring	Solicitações de ingestão de séries temporais
API Cloud Monitoring	Consultas de série temporal
API Cloud Resource Manager	Solicitações de leitura por minuto
API Cloud Run Admin	Solicitações de execução de jobs por minuto e por região
API Cloud Run Admin	Solicitações de leitura por minuto e por região
API Cloud Run Admin	Alocação total de CPUs, em mili vCPU, por projeto e por região
API Cloud Run Admin	Solicitações de gravação por minuto e por região
API Cloud Trace	Solicitações de gravação (sem custos) por minuto
API Compute Engine	Grupos de afinidade
API Compute Engine	Buckets de back-end
API Compute Engine	CPUs C2
API Compute Engine	CPUs C2D
API Compute Engine	CPUs C3
API Compute Engine	Compromissos
API Compute Engine	CPUs A2 com compromisso de uso
API Compute Engine	CPUs com compromisso de uso
API Compute Engine	Licenças em uso
API Compute Engine	Disco SSD local reservado com compromisso de uso (GB)
API Compute Engine	CPUs M3 com compromisso de uso
API Compute Engine	CPUs com otimização de memória e compromisso de uso
API Compute Engine	CPUs N2 com compromisso de uso
API Compute Engine	CPUs N2D com compromisso de uso
API Compute Engine	CPUs T2D com compromisso de uso
API Compute Engine	CPUs
API Compute Engine	CPUs por família de VMs
API Compute Engine	Projetos do serviço de redes entre projetos
API Compute Engine	Serviços de back-end do balanceador de carga de rede de passagem externo
API Compute Engine	Regras de encaminhamento do balanceador de carga de rede de passagem externo
API Compute Engine	Regras de encaminhamento de protocolo externo
API Compute Engine	Gateways de VPN externos
API Compute Engine	Regras de firewall
API Compute Engine	Regras de encaminhamento
API Compute Engine	Serviços de back-end gerenciados externos globais
API Compute Engine	Buckets de back-end gerenciados internos globais
API Compute Engine	Serviços de back-end gerenciados internos globais
API Compute Engine	Políticas de SSL globais
API Compute Engine	Regras de encaminhamento gerenciadas externas globais
API Compute Engine	Serviços de back-end de balanceador de carga de proxy externo global
API Compute Engine	Serviços de back-end do Traffic Director interno global
API Compute Engine	Contagem de GPUs por família de GPUs
API Compute Engine	GPUs (todas as regiões)
API Compute Engine	Verificações de integridade
API Compute Engine	Imagens
API Compute Engine	Grupos de anexos de interconexão
API Compute Engine	Anexos de interconexão
API Compute Engine	Anexos de interconexão por interconexão
API Compute Engine	Total em Mbps dos anexos de interconexão
API Compute Engine	Grupos de interconexões
API Compute Engine	Interconexões
API Compute Engine	Endereços IP em uso
API Compute Engine	Endereços IPv4 externos regionais em uso
API Compute Engine	Programações de snapshots em uso
API Compute Engine	Grupos de instâncias
API Compute Engine	Modelos de instância
API Compute Engine	Instâncias por grupo de peering
API Compute Engine	Instâncias por rede VPC
API Compute Engine	Regras de encaminhamento interno por grupo de peering
API Compute Engine	Regras de encaminhamento de protocolo interno por rede VPC
API Compute Engine	Endereços IP internos
API Compute Engine	Serviços de back-end do balanceador de carga de rede de passagem interno
API Compute Engine	Regras de encaminhamento do balanceador de carga de rede de passagem interno por grupo de peering
API Compute Engine	Regras de encaminhamento do balanceador de carga de rede de passagem interno por rede VPC
API Compute Engine	Aliases de IP por grupo de peering
API Compute Engine	Alias de IP por rede VPC
API Compute Engine	Disco SSD local por família de VMs (GB)
API Compute Engine	CPUs M1
API Compute Engine	CPUs M2
API Compute Engine	CPUs M3
API Compute Engine	Grupos gerenciados de instâncias
API Compute Engine	CPUs N2
API Compute Engine	CPUs N2D
API Compute Engine	Anexos de rede
API Compute Engine	Grupos de endpoints de rede
API Compute Engine	Políticas de firewall de rede
API Compute Engine	Políticas de segurança de balanceamento de carga de rede
API Compute Engine	Regras da política de segurança de balanceamento de carga de rede
API Compute Engine	Atributos de regra da política de segurança de balanceamento de carga de rede
API Compute Engine	Redes
API Compute Engine	CPUs NVIDIA A2
API Compute Engine	Espelhamentos de pacotes
API Compute Engine	IOPS do Persistent Disk
API Compute Engine	SSD do Persistent Disk (GB)
API Compute Engine	Persistent Disk padrão (GB)
API Compute Engine	CPUs preemptivas
API Compute Engine	SSD local preemptivo (GB)
API Compute Engine	GPUs NVIDIA A100 preemptivas de 80 GB
API Compute Engine	GPUs NVIDIA A100 preemptivas
API Compute Engine	GPUs NVIDIA H100 preemptivas
API Compute Engine	GPUs NVIDIA H100 MEGA preemptivas
API Compute Engine	GPUs NVIDIA K80 preemptivas
API Compute Engine	GPUs NVIDIA L4 preemptivas
API Compute Engine	GPUs NVIDIA L4 preemptivas para estações de trabalho virtuais
API Compute Engine	GPUs NVIDIA P100 preemptivas
API Compute Engine	GPUs NVIDIA P100 preemptivas para estações de trabalho virtuais
API Compute Engine	GPUs NVIDIA P4 preemptivas
API Compute Engine	GPUs NVIDIA P4 preemptivas para estações de trabalho virtuais
API Compute Engine	GPUs NVIDIA T4 preemptivas
API Compute Engine	GPUs NVIDIA T4 preemptivas para estações de trabalho virtuais
API Compute Engine	GPUs NVIDIA V100 preemptivas
API Compute Engine	Prefixos públicos anunciados
API Compute Engine	Regras de encaminhamento de consumidor do ILB de PSC por rede VPC do produtor
API Compute Engine	Regras de encaminhamento do balanceador de carga interno de PSC
API Compute Engine	Serviços de back-end gerenciados externos regionais
API Compute Engine	Regras de encaminhamento gerenciadas externas regionais por região e por rede VPC
API Compute Engine	Modelos de instâncias regionais
API Compute Engine	Regras de encaminhamento do balanceador de carga gerenciado interno regional por região e por rede VPC
API Compute Engine	Serviços de back-end gerenciados internos regionais
API Compute Engine	Serviços de back-end do Traffic Director interno regional
API Compute Engine	Grupos gerenciados de instâncias regionais
API Compute Engine	Políticas regionais de firewall da rede
API Compute Engine	Políticas de segurança regionais
API Compute Engine	Regras de política de segurança regionais
API Compute Engine	Regras de política de segurança regional com uma condição de correspondência avançada
API Compute Engine	Políticas de SSL regional
API Compute Engine	Proxies TCP de destino regionais
API Compute Engine	Roteadores
API Compute Engine	Atributos de regra por política de firewall de rede global
API Compute Engine	Atributos de regra por política de firewall de rede regional
API Compute Engine	Políticas de segurança
API Compute Engine	Regras da política de segurança
API Compute Engine	Regras de linguagem das regras da política de segurança
API Compute Engine	Anexos de serviço
API Compute Engine	Snapshots
API Compute Engine	Certificados SSL
API Compute Engine	Endereços IP BYOIP estáticos
API Compute Engine	Endereços IP estáticos
API Compute Engine	Endereços IPv4 internos globais estáticos
API Compute Engine	Intervalos de sub-redes por grupo de peering
API Compute Engine	Intervalos de sub-redes por rede VPC
API Compute Engine	CPUs T2A
API Compute Engine	CPUs T2D
API Compute Engine	Proxies HTTP de destino
API Compute Engine	Proxies HTTPS de destino
API Compute Engine	Proxies SSL de destino
API Compute Engine	Proxies TCP de destino
API Compute Engine	Instâncias de destino
API Compute Engine	Pools de destino
API Compute Engine	Gateways VPN de destino
API Compute Engine	Total do disco SSD local reservado (GB)
API Compute Engine	Regras de encaminhamento do Traffic Director
API Compute Engine	Prefixos de rota dinâmica do Cloud Router exclusivos de outras regiões para cada região por rede VPC
API Compute Engine	Prefixos de rota dinâmica do Cloud Router exclusivos da própria região para cada região por rede VPC
API Compute Engine	Mapas de URL
API Compute Engine	Instâncias de VM
API Compute Engine	Gateways VPN
API Compute Engine	Túneis VPN
API Connect Gateway	Solicitações de conexão de gateway por minuto
API Dialogflow	Todas as outras solicitações por minuto
API Filestore	Backups por região
API Filestore	Capacidade do HDD básico (padrão) por região (GB)
API Filestore	Capacidade do SSD básico (Premium) por região (GB)
API Filestore	Capacidade zonal e regional de 1 a 10 TiB (Enterprise) por região (GB)
API Filestore	Capacidade zonal e regional de 10 a 100 TiB (alta escala) por região (GB)
API Memorystore for Redis doGoogle Cloud	Capacidade total do Redis por região (GB)
API Memorystore for Redis doGoogle Cloud	Total de unidades do cluster do Redis por projeto e por região
API Google Sheets	Solicitações de leitura por minuto por projeto
API Google Sheets	Solicitações de leitura por minuto por usuário
API Google Sheets	Solicitações de gravação por minuto e por projeto
API Google Sheets	Solicitações de gravação por minuto e por usuário
API Memorystore	Total de unidades do Memorystore por projeto e por região
Remote Build Execution	Número de CPUs N2 reservadas (por região)
API Transcoder	Contagem de jobs simultâneos em lote
API Transcoder	Contagem de jobs pendentes em lote
API Transcoder	Contagem de jobs simultâneos
API Transcoder	Contagem de jobs de dublagem
API Transcoder	Receber solicitações
API Transcoder	Solicitações de lista
API Transcoder	Solicitações de mutação
API Vertex AI	CPUs personalizadas de disponibilização de modelos por região
API Vertex AI	GPUs NVIDIA T4 personalizadas de disponibilização de modelos por região
API Vertex AI	GPUs NVIDIA T4 personalizadas de treinamento de modelos por região
API Vertex AI	Solicitações de geração de conteúdo por minuto, por projeto e por modelo de base
API Vertex AI	Solicitações regionais de previsão on-line por minuto, por projeto e por modelo de base Observação: para conferir a lista completa de dimensões disponíveis, expanda esta entrada no console do Google Cloud .
API Vertex AI	Solicitações de gerenciamento de recursos (CRUD) por minuto e por região
API Vertex AI	Núcleos de pod TPU V3 de treinamento de imagens restritos por região

Ativar o ajustador de cotas

Para ativar o ajustador de cotas, é necessário ter as seguintes permissões do Identity and Access Management:

cloudquotas.quotas.update
cloudquotas.quotas.get

Para ativar o ajustador de cotas, selecione a guia apropriada e siga as instruções:

Console

No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
Acessar Cotas e limites do sistema
Clique na guia Configurações.
Clique no botão para Ativar.

Quando a coluna Status mostrar Ativado, o ajustador de cotas vai monitorar seu uso de recursos e emitir solicitações de ajuste de cota quando esse uso se aproximar do limite.

Para ativar o ajuste de cota por pasta ou organização, use a API REST ou a CLI gcloud.

REST

Faça uma solicitação HTTP para atualizar as configurações do ajustador de cotas:

PATCH https://cloudquotas.googleapis.com/v1beta/RESOURCE_CONTAINER/ID/locations/global/quotaAdjusterSettings

No corpo da solicitação, especifique o contêiner de recursos de configurações do ajustador de cotas e defina o campo enablement como ENABLED. Também é possível especificar uma ETag, mas isso é opcional:
```
{
  name: RESOURCE_CONTAINER/ID/locations/global/quotaAdjusterSettings
  enablement: ENABLED
  etag: OPTIONAL_ETAG
}
```
Substitua:
- RESOURCE_CONTAINER: o tipo de contêiner de recursos: projects, folders ou organizations.
- ID: o ID ou número do projeto, pasta ou organização em que você quer ativar o ajustador de cotas.
- OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cotas.
Isso atualiza o status de ativação para enabled.

gcloud

Faça a autenticação usando a gcloud CLI:
```
gcloud auth login
```
Para ativar as configurações do ajustador de cotas, use o comando gcloud beta quotas adjuster settings update.

Ativar o ajustador de cotas em um projeto

Para especificar um projeto, use a flag --project:
```
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
```
Substitua PROJECT_ID_OR_NUMBER pelo ID do projeto ou número do projeto em que você quer ativar o ajustador de cotas.

Ativar o ajustador de cotas em uma pasta

Para especificar uma pasta, use a flag --folder:
```
gcloud beta quotas adjuster settings update --folder=FOLDER_ID --enablement=enabled
```
Substitua FOLDER_ID pelo ID da pasta em que você quer ativar o ajustador de cotas.

Ativar o ajustador de cotas em uma organização

Para especificar uma organização, use a flag --organization:
```
gcloud beta quotas adjuster settings update --organization=ORGANIZATION_ID --enablement=enabled
```
Substitua ORGANIZATION_ID pelo ID da organização em que você quer ativar o ajustador de cotas.
Verifique o status de ativação:
```
gcloud beta quotas adjuster settings describe --RESOURCE_CONTAINER_TYPE=ID
```
Substitua:
- RESOURCE_CONTAINER_TYPE: o tipo de contêiner de recursos: project, folder ou organization.
- ID: o ID do projeto, da pasta ou da organização para que você quer ver o status de ativação.
Se você tiver as permissões necessárias, o status será retornado como enabled.

Conferir solicitações de ajuste de cota

Para conferir as solicitações de ajuste de cota, você precisa das seguintes permissões do IAM:

resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get

Para conferir as solicitações de ajuste de cota emitidas pelo ajustador de cotas, faça o seguinte:

No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
Acessar Cotas e limites do sistema
Clique na guia Solicitações de aumento. A visualização Solicitações de aumento mostra as solicitações de aumento do projeto, incluindo aumentos solicitados manualmente e solicitações emitidas pelo ajustador de cotas.
Clique no campo Filtro.
Selecione Tipo no menu e digite Auto. Com isso, será possível filtrar as solicitações feitas pelo ajustador de cotas.

Configurar alertas do ajustador de cotas

Para receber alertas do ajustador de cotas, faça o seguinte:

No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
Acessar Cotas e limites do sistema
Clique na guia Configurações.
Clique em Criar alerta.
Selecione um dos modelos de alerta ou ambos:
1. A opção Todos os ajustes feitos pelo ajustador de cotas envia um alerta sempre que o ajustador emite uma solicitação de ajuste de cotas para o projeto.
2. A opção Erros e falhas do ajustador de cotas envia alertas somente quando o ajustador tenta aumentar um limite de cota e não consegue.
Opcional: clique em Mostrar opções para ajustar os valores padrão de tempo mínimo entre alertas e a duração até o encerramento automático do incidente.
Selecione Canal de notificação para receber alertas. Para ajustar as configurações do canal de notificação ou criar um canal, clique em Gerenciar canais de notificação.
Clique em Criar.

Editar ou excluir alertas do ajustador de cotas

É possível editar ou excluir os alertas do ajustador de cotas no console doGoogle Cloud :

Acesse a página Políticas no console do Cloud Monitoring.

Acessar Políticas
Pesquise a política de alertas do ajustador de cotas. Essas políticas têm os seguintes nomes:
- Quota adjuster errors and failures
- All adjustments by quota adjuster
Na linha que mostra a política de alertas do ajustador de cotas, clique em Ver mais.
Clique em Editar ou em Excluir.

Desativar o ajustador de cotas

Para desativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:

cloudquotas.quotas.update
cloudquotas.quotas.get

Para desativar o ajustador de cotas, selecione a guia apropriada e siga as instruções:

Console

No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
Acessar Cotas e limites do sistema
Clique na guia Configurações.
Clique no botão para Ativar. O botão fica cinza.

Quando o botão fica cinza e a coluna de status mostra Não ativado, o ajustador de cotas não monitora mais o uso nem emite solicitações de ajuste de cota.

Para desativar o ajuste de cota por pasta ou organização, use a API REST ou a CLI gcloud.

REST

Faça uma solicitação HTTP para atualizar as configurações do ajustador de cotas:

PATCH https://cloudquotas.googleapis.com/v1beta/RESOURCE_CONTAINER/ID/locations/global/quotaAdjusterSettings

No corpo da solicitação, especifique o contêiner de recursos de configurações do ajustador de cotas e defina o campo enablement como DISABLED. Também é possível especificar uma ETag, mas isso é opcional:
```
{
  name: RESOURCE_CONTAINER/ID/locations/global/quotaAdjusterSettings
  enablement: DISABLED
  etag: OPTIONAL_ETAG
}
```
Substitua:
- RESOURCE_CONTAINER: o tipo de contêiner de recursos: projects, folders ou organizations.
- ID: o ID ou número do projeto, da pasta ou da organização em que você quer desativar o ajustador de cotas.
- OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cotas.
Isso atualiza o status de ativação para disabled.

gcloud

Autentique-se na gcloud CLI:
```
gcloud auth login
```
Para desativar as configurações do ajustador de cotas, use o comando gcloud beta quotas adjuster settings update.

Desativar o ajustador de cotas em um projeto

Para especificar um projeto, use a flag --project:
```
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
```
Substitua PROJECT_ID_OR_NUMBER pelo ID do projeto ou número do projeto em que você quer desativar o ajustador de cotas.

Desativar o ajustador de cotas em uma pasta

Para especificar uma pasta, use a flag --folder:
```
gcloud beta quotas adjuster settings update --folder=FOLDER_ID --enablement=disabled
```
Substitua FOLDER_ID pelo ID da pasta em que você quer desativar o ajustador de cotas.

Desativar o ajustador de cotas em uma organização

Para especificar uma organização, use a flag --organization:
```
gcloud beta quotas adjuster settings update --organization=ORGANIZATION_ID --enablement=disabled
```
Substitua ORGANIZATION_ID pelo ID da organização em que você quer desativar o ajustador de cotas.
Verifique o status de ativação:
```
gcloud beta quotas adjuster settings describe --RESOURCE_CONTAINER_TYPE=ID
```
Substitua:
- RESOURCE_CONTAINER_TYPE: o tipo de contêiner de recursos: project, folder ou organization.
- ID: o ID do projeto, da pasta ou da organização para que você quer ver o status de ativação.
Se você tiver as permissões necessárias, o status será retornado como disabled.

Resolver problemas de negação do aumento de cota

É possível que um aumento de cota iniciado pelo ajustador seja negado. Às vezes, isso ocorre quando o Google Cloud não consegue aumentar o limite de cota em um projeto, recurso ou região além de um determinado valor. Nesses casos, ainda é possível solicitar um aumento manual de cota.

Para receber notificações quando uma solicitação de ajuste de cota feita pelo ajustador for negada, configure os alertas do ajustador de cotas.

Usar o ajustador de cotas Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Como o ajustador de cotas funciona

Limitações

Disponibilidade

Qualificação com base no histórico de uso

Cotas aceitas

Ativar o ajustador de cotas

Console

REST

gcloud

Ativar o ajustador de cotas em um projeto

Ativar o ajustador de cotas em uma pasta

Ativar o ajustador de cotas em uma organização

Conferir solicitações de ajuste de cota

Configurar alertas do ajustador de cotas

Editar ou excluir alertas do ajustador de cotas

Desativar o ajustador de cotas

Console

REST

gcloud

Desativar o ajustador de cotas em um projeto

Desativar o ajustador de cotas em uma pasta

Desativar o ajustador de cotas em uma organização

Resolver problemas de negação do aumento de cota

Usar o ajustador de cotas