Antes do evento de capacidade máxima, gerencie e otimize os recursos que são usados pelas Google Cloud cargas de trabalho do. Isso envolve dimensionar os recursos de acordo com o uso e a demanda reais, usar o escalonamento automático para alocação dinâmica de recursos e analisar as recomendações de arquitetura e segurança. O Cloud Monitoring e o Recommender (Active Assist) podem ajudar você a identificar oportunidades para otimizar seus recursos de nuvem. Ao usar essas ferramentas, você pode ter insights sobre o uso de recursos e tomar decisões fundamentadas antes do evento.
Revise as práticas recomendadas do Google Cloud .
Muitos problemas de eventos de capacidade máxima podem ser evitados seguindo as práticas recomendadas para o produto que você está usando. Google Cloud Confira alguns exemplos de guias de práticas recomendadas:
| Geral | |
| BigQuery | |
| Cloud Storage | |
| Compute Engine | |
| Dataflow | |
| Managed Service for Apache Spark | |
| Google Kubernetes Engine |
Analise a escalonabilidade.
O escalonamento automático garante que os aplicativos baseados na nuvem tenham os recursos necessários para lidar com cargas de trabalho variáveis, evitando o provisionamento excessivo e custos desnecessários. Google Cloud oferece várias opções de escalonamento automático específicas do produto, incluindo as seguintes:
- Os grupos gerenciados de instâncias (MIGs) do Compute Engine são grupos de VMs gerenciados e escalonados como uma única entidade. Com os MIGs, é possível definir políticas de escalonamento automático que especificam o número mínimo e máximo de VMs a serem mantidas no grupo e as condições que acionam o escalonamento automático.
- O escalonamento automático do Google Kubernetes Engine (GKE) ajusta dinamicamente os recursos do cluster para atender às necessidades do aplicativo. Ele oferece ferramentas que podem otimizar a utilização de recursos, garantir a performance do aplicativo e simplificar o gerenciamento de clusters.
- O Cloud Run oferece escalonamento automático integrado, que ajusta automaticamente o número de instâncias com base no tráfego de entrada.
Antes do evento, recomendamos que você escalonar verticalmente manual. Embora o escalonamento automático possa estar configurado, devido à velocidade do tráfego de eventos, ele talvez não consiga acompanhar a demanda. Portanto, pré-aqueça os recursos com antecedência, incluindo o seguinte:
- Máquinas virtuais
- Caches se você quiser pré-carregar
- Componentes sem servidor para evitar inicializações a frio
Analisar as recomendações do Active Assist
O Active Assist se refere ao portfólio de ferramentas usadas em Google Cloud para gerar recomendações e insights que ajudam a otimizar seus projetos do Google Cloud . Para mais informações, consulte O que é o Active Assist.
Analise as versões do produto.
Verifique se todos os produtos e serviços de nuvem estão atualizados com a versão estável mais recente.
Analise alertas e painéis.
Identifique e resolva problemas de maneira proativa avaliando os alertas e painéis fornecidos pelas ferramentas do Google Cloud Observability e soluções de terceiros.
Verifique as métricas, os registros e os rastros do Google Cloud Observability para ter insights sobre a utilização de recursos, as características de performance e a integridade geral dos recursos. Monitore métricas importantes que estejam alinhadas aos indicadores de integridade do sistema, como utilização da CPU, uso de memória, tráfego de rede, E/S de disco e tempos de resposta do aplicativo. Considere também métricas específicas dos negócios. Ao acompanhar essas métricas, você pode identificar possíveis gargalos, problemas de performance e restrições de recursos. Além disso, é possível configurar alertas para notificar as equipes relevantes de maneira proativa sobre possíveis problemas ou anomalias.
Para alertas, concentre-se em métricas críticas, defina limites adequados para minimizar a sobrecarga de alertas e garanta respostas rápidas a problemas significativos. Essa abordagem direcionada permite manter a confiabilidade da carga de trabalho de maneira proativa. Para mais informações, consulte a Visão geral de alertas.