Veja neste documento as cotas e os limites do sistema que se aplicam a Google Kubernetes Engine.
- As cotas têm valores definidos por padrão, mas geralmente é possível solicitar ajustes.
- Os limites do sistema são valores fixos que não podem ser alterados.
OGoogle Cloud usa cotas para garantir a distribuição justa e reduzir sobrecargas no uso e na disponibilidade dos recursos. Uma cota restringe a alocação de um recurso doGoogle Cloud para uso do seu projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de produtos e serviços do Google Cloud .
- Restringe o consumo desses recursos.
- Possibilita a solicitação de mudanças no valor das cotas e a automatização de ajustes de cotas.
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Saiba mais em Visão geral das cotas do Cloud.
Para ajustar a maioria das cotas, use o console do Google Cloud . Para mais informações, consulte Solicitar ajuste de cota.
Também há limites de sistemas nos recursos do GKE. Os limites do sistema não podem ser alterados.
Cotas por projeto
O GKE tem as seguintes cotas:
- Clusters zonais por zona
- Clusters regionais por região
- Leituras de API
- Gravações de API
Observação: os clusters criados no modo de Autopilot são pré-configurados como clusters regionais.
Verificar sua cota
As cotas podem ser visualizadas no Google Cloud console, acesse a página Cotas.
Para mais informações sobre como gerenciar cotas, consulte Visualizar e gerenciar cotas.
Limites por cluster
As tabelas a seguir descrevem os limites por cluster do GKE.
Todas as versões do GKE especificadas na tabela a seguir se aplicam aos nós do cluster e ao plano de controle.
| Limites | Cluster do GKE Standard | Cluster do GKE Autopilot |
|---|---|---|
| Nós por cluster |
65.000 nós
Nem todos os aumentos de cota de nós são automáticos. Dependendo da contagem de nós de destino (por exemplo, até 5.000 nós, até 15.000 nós ou até 65.000 nós), há requisitos de infraestrutura específicos, e talvez seja necessário entrar em contato com o Cloud Customer Care. Para informações detalhadas, consulte Limites e requisitos de tamanho do cluster. |
5.000 nós
Se você planeja usar esse limite, considere as seguintes recomendações ao projetar sua arquitetura do GKE:
|
| Nós por pool de nós | 1.000 nós por zona 2.000 nós de TPU por zona : exige as seguintes versões ou mais recentes: 1.28.5-gke.135500, 1.29.1-gke.1206000, 1.30 |
Não relevante |
| Nós em uma zona |
|
Não relevante |
| Pods por nó1 |
256 pods
Observação: para versões do GKE anteriores à 1.23.5-gke.1300, o limite é de 110 pods. |
Defina dinamicamente para qualquer valor entre 8 e 256. O GKE considera o tamanho do cluster e o número de cargas de trabalho para provisionar o máximo de pods por nó.
|
| Pods por cluster2 | 200.000 pods1 | 200.000 Pods |
| Contêineres por cluster | 400.000 contêineres | 400.000 contêineres |
| Tamanho do banco de dados de Etcd | 6 GB | 6 GB |
| Operações simultâneas | 100 operações | 100 operações |
Como administrador da plataforma, é recomendado familiarizar-se com a forma como as cotas afetam as cargas de trabalho grandes executadas no GKE. Para conferir outras recomendações, práticas recomendadas, limites e cotas para cargas de trabalho grandes, consulte Diretrizes para criar clusters escalonáveis.
Cotas de recursos
Para clusters com menos de 100 nós, o GKE aplica a cota de recursos do Kubernetes a cada namespace. Essas cotas protegem o plano de controle do cluster contra a instabilidade causada por possíveis bugs nos aplicativos implantados no cluster. Não é possível remover essas cotas porque elas são aplicadas pelo GKE.
O GKE atualiza automaticamente os valores da cota de recursos proporcionalmente ao número de nós. Para clusters com mais de 100 nós, o GKE remove a cota de recursos.
Para examinar as cotas de recursos, use o comando a seguir:
kubectl get resourcequota gke-resource-quotas -o yaml
Para conferir os valores de um determinado namespace, especifique-o adicionando a opção
--namespace.
Observações
-
O número máximo de pods por cluster padrão do GKE inclui pods do sistema. O número de pods do sistema varia de acordo com a configuração do cluster e os recursos ativados. ↩
-
O número máximo de pods que podem caber em um nó depende do tamanho das solicitações de recursos do pod e da capacidade do nó. Talvez você não atinja todos os limites ao mesmo tempo. Como prática recomendada, carregue implantações de teste grandes. ↩