Antes do evento de pico de capacidade, gerencie e otimize os recursos usados pelas cargas de trabalho do Google Cloud . Isso envolve dimensionar os recursos de acordo com o uso e a demanda reais, usar o escalonamento automático para alocação dinâmica de recursos e analisar as recomendações de arquitetura e segurança. O Cloud Monitoring e o Recommender (Active Assist) ajudam a identificar oportunidades para otimizar seus recursos de nuvem. Com essas ferramentas, é possível ter insights sobre o uso de recursos e tomar decisões fundamentadas antes do evento.
Revise as práticas recomendadas do Google Cloud .
Muitos problemas de eventos de pico de capacidade podem ser evitados seguindo as práticas recomendadas para o produto Google Cloud que você está usando. Confira alguns exemplos de guias de práticas recomendadas:
| Geral | |
| BigQuery | |
| Cloud Storage | |
| Compute Engine | |
| Dataflow | |
| Dataproc | |
| Google Kubernetes Engine |
Analise a escalonabilidade.
O escalonamento automático garante que seus aplicativos baseados na nuvem tenham os recursos necessários para lidar com cargas de trabalho variadas, evitando provisionamento excessivo e custos desnecessários.O Google Cloud oferece várias opções de escalonamento automático específicas do produto, incluindo:
- Os grupos gerenciados de instâncias (MIGs) do Compute Engine são grupos de VMs gerenciados e escalonados como uma única entidade. Com os MIGs, é possível definir políticas de escalonamento automático que especificam o número mínimo e máximo de VMs a serem mantidas no grupo, além das condições que acionam o escalonamento automático.
- O escalonamento automático do Google Kubernetes Engine (GKE) ajusta dinamicamente os recursos do cluster para atender às necessidades do seu aplicativo. Ele oferece ferramentas que podem otimizar a utilização de recursos, garantir o desempenho dos aplicativos e simplificar o gerenciamento de clusters.
- O Cloud Run oferece escalonamento automático integrado, que ajusta automaticamente o número de instâncias com base no tráfego de entrada.
Antes do evento, recomendamos que você escalonar verticalmente manual. Embora você tenha configurado o escalonamento automático, devido à velocidade do tráfego de eventos, ele talvez não consiga acompanhar a demanda. Portanto, faça o pré-aquecimento dos recursos com antecedência, incluindo:
- Máquinas virtuais
- Caches se você quiser pré-carregar
- Componentes sem servidor para evitar inicializações a frio
Analisar as recomendações do Active Assist
O Active Assist se refere ao portfólio de ferramentas usadas em Google Cloud para gerar recomendações e insights que ajudam a otimizar seus projetos do Google Cloud . Para mais informações, consulte O que é o Active Assist.
Analise as versões do produto.
Confira se todos os seus produtos e serviços de nuvem estão atualizados com a versão estável mais recente.
Analise alertas e painéis.
Identifique e resolva problemas de forma proativa avaliando os alertas e painéis fornecidos pelas ferramentas de observabilidade do Google Cloud e soluções de terceiros.
Confira as métricas, os registros e os rastreamentos do Google Cloud Observability para receber insights sobre a utilização de recursos, as características de desempenho e a integridade geral dos seus recursos. Monitore métricas importantes que se alinham aos indicadores de integridade do sistema, como uso da CPU, uso de memória, tráfego de rede, E/S de disco e tempos de resposta do aplicativo. Considere também métricas específicas da empresa. Ao rastrear essas métricas, é possível identificar possíveis gargalos, problemas de desempenho e restrições de recursos. Além disso, você pode configurar alertas para notificar as equipes relevantes de forma proativa sobre possíveis problemas ou anomalias.
Para alertas, concentre-se em métricas críticas, defina limites adequados para minimizar a sobrecarga de alertas e garanta respostas rápidas a problemas significativos. Essa abordagem direcionada permite manter a confiabilidade da carga de trabalho de maneira proativa. Para mais informações, consulte a Visão geral de alertas.