Este documento explica como identificar cargas de trabalho com aprovisionamento insuficiente e excessivo que são executadas em clusters do Google Kubernetes Engine (GKE) através de estatísticas e recomendações. Depois de verificar que as cargas de trabalho identificadas beneficiariam da recomendação para aumentar ou diminuir a escala, pode fazer a alteração recomendada para poupar custos ou aumentar a fiabilidade da sua carga de trabalho. Se possível, a recomendação inclui a poupança ou o custo mensal previsto. Para mais informações, consulte o artigo Compreenda as estimativas de custos ou poupanças.
O GKE fornece estas estatísticas sobre as cargas de trabalho executadas em clusters do Autopilot e Standard. O GKE também oferece recomendações semelhantes para clusters completos. Para mais informações, consulte o artigo Identifique clusters do GKE com aprovisionamento insuficiente e excessivo.
O GKE monitoriza os seus clusters e fornece orientações para otimizar a sua utilização através do Active Assist, um serviço que fornece recomendadores que geram estatísticas e recomendações para a utilização de recursos no Google Cloud. Para mais informações sobre como gerir estatísticas e recomendações, consulte o artigo Otimize a sua utilização do GKE com estatísticas e recomendações.
Receba estatísticas e recomendações para cargas de trabalho com aprovisionamento insuficiente e excessivo
O GKE apresenta estas estatísticas e recomendações nas seguintes localizações na consola após observar o comportamento específico abordado na secção seguinte: Google Cloud
As recomendações têm os seguintes títulos na página Cargas de trabalho:
- Cargas de trabalho com oferta excessiva: "Diminua os pedidos de recursos para reduzir os custos"
- Cargas de trabalho com oferta insuficiente: "Aumente os pedidos de recursos para melhorar a fiabilidade"
Também pode receber todos os tipos de estatísticas e recomendações através da
CLI Google Cloud ou da API Recommender. Para encontrar especificamente estes tipos,
siga as instruções para ver estatísticas e
recomendações
e filtre-as através dos subtipos WORKLOAD_UNDERPROVISIONED e WORKLOAD_OVERPROVISIONED.
Depois de identificar cargas de trabalho com aprovisionamento insuficiente ou excessivo, consulte as considerações ao ajustar o tamanho das cargas de trabalho.
Como o GKE identifica cargas de trabalho com aprovisionamento insuficiente e excessivo
A tabela seguinte descreve os sinais que o GKE usa para identificar cargas de trabalho com aprovisionamento insuficiente e excessivo que podem ser dimensionadas para cima ou para baixo, e o limite para cada sinal. Além disso, esta tabela mostra a ação que recomendamos que tome neste cenário.
| Subtipo | Sinal | Período de observação | Detalhes | Recomendação |
|---|---|---|---|---|
WORKLOAD_UNDERPROVISIONED |
A utilização da CPU ou da memória é elevada | Últimos 15 dias | Uma carga de trabalho está subaprovisionada quando a utilização da CPU ou da memória é superior a 150% durante, pelo menos, 10% do tempo nos últimos 15 dias. | Aumente a sua carga de trabalho para aumentar a fiabilidade |
WORKLOAD_OVERPROVISIONED |
A utilização da CPU ou da memória é baixa | Últimos 15 dias | Uma carga de trabalho está sobreaprovisionada quando a utilização da CPU ou da memória é inferior a 50% durante, pelo menos, 90% do tempo nos últimos 15 dias. | Reduza a sua carga de trabalho para poupar custos |
O GKE também usa as seguintes diretrizes para determinar quando fornecer estatísticas e recomendações:
- O GKE não gera recomendações para a métrica alvo do ajuste automático horizontal de pods (HPA) porque a utilização desta métrica pode causar interferência.
- Se a escala automática vertical de pods (VPA) estiver ativada, os valores dos pedidos são geridos automaticamente e o GKE não precisa de gerar uma recomendação.
- O GKE pode aguardar até três dias antes de gerar recomendações para novas cargas de trabalho.
Compreenda as estimativas de custos ou poupanças
Se possível, a recomendação do GKE inclui uma estimativa que projeta o custo ou a poupança mensal se ajustar a carga de trabalho ao tamanho certo. Esta estimativa é derivada dos custos da carga de trabalho, com base na média ponderada dos valores dos pedidos combinados com o custo de CPU e memória da carga de trabalho nos últimos 30 dias.
Todos os custos ou poupanças estimados são projeções baseadas em gastos anteriores e não são uma garantia de custos ou poupanças futuras.
Para ver estas estimativas, certifique-se de que as seguintes condições são satisfeitas:
- Tem a autorização
billing.accounts.getSpendingInformationnecessária para receber informações sobre os gastos. Para mais informações, consulte o artigo Acesso à faturação do Google Cloud. - A atribuição de custos do GKE está ativada para o cluster. Para mais informações, consulte o artigo Ative a atribuição de custos do GKE.
Para mais informações sobre o custo de todos os seus clusters do GKE, incluindo uma discriminação mais detalhada com base nos espaços de nomes e nas cargas de trabalho, consulte o artigo Obtenha informações importantes sobre os gastos para a atribuição de recursos do GKE e os custos dos clusters.
Para mais informações sobre os custos de execução de um cluster do GKE, consulte os preços do GKE.
Considerações ao ajustar as cargas de trabalho
Antes de seguir uma recomendação para aumentar ou diminuir uma carga de trabalho, considere o seguinte:
- Reveja a utilização de recursos da carga de trabalho para ver o respetivo desempenho e se está a usar mais ou menos CPU e memória do que o esperado. Para ver instruções, consulte o artigo Analise os pedidos de recursos.
- As cargas de trabalho de processamento em lote podem manter intencionalmente uma utilização elevada para eficiência de custos. Se os recursos atribuídos forem suficientes para os trabalhos em lote, não precisa de aumentar a escala da carga de trabalho muito usada, que foi identificada como subaprovisionada.
- O GKE tem visibilidade limitada da utilização real de memória das cargas de trabalho baseadas na máquina virtual Java (JVM). Use uma análise mais detalhada antes de aplicar recomendações para estes tipos de cargas de trabalho.
Implemente a recomendação para ajustar uma carga de trabalho
Pode ajustar o tamanho de uma carga de trabalho para corresponder melhor à utilização de recursos da carga de trabalho através de qualquer uma das seguintes opções:
- Ative o dimensionamento automático vertical de pods para a carga de trabalho. Para mais informações, consulte o artigo Defina automaticamente pedidos de recursos de pods.
Altere os pedidos e os limites manualmente de acordo com a recomendação:
- Carga de trabalho com recursos insuficientes: para implementar a recomendação de ajustar o tamanho de uma carga de trabalho com recursos insuficientes, aumente os pedidos de recursos e os limites da carga de trabalho. Quando implementa esta recomendação, ajuda a garantir que a sua carga de trabalho permanece fiável porque tem a quantidade adequada de recursos para as respetivas aplicações.
- Carga de trabalho com oferta excessiva: para implementar a recomendação de ajustar o tamanho de uma carga de trabalho com oferta excessiva, diminua os pedidos e os limites de recursos para a carga de trabalho. Ajuste as atribuições de CPU e memória do cluster para corresponderem às necessidades da sua carga de trabalho. Quando implementa esta recomendação, ajuda a garantir que usa apenas os recursos de que precisa para executar a sua carga de trabalho.
O que se segue?
- Veja métricas de otimização relacionadas com custos
- Reduzir os custos diminuindo a escala dos clusters do GKE durante as horas fora de ponta
- Otimize a sua utilização do GKE com estatísticas e recomendações
- Práticas recomendadas para executar aplicações Kubernetes otimizadas em termos de custos no GKE
- 5 funcionalidades do GKE para ajudar a otimizar os seus clusters