Esta página descreve como pode compreender o estado de funcionamento das suas aplicações e manter a disponibilidade e a fiabilidade das aplicações.
Funcionalidades de observabilidade predefinidas
Por predefinição, os clusters do GKE estão configurados para fazer o seguinte:
- Enviar registos do sistema, registos de auditoria e registos de aplicações para o Cloud Logging.
- Enviar métricas do sistema para o Cloud Monitoring.
- Use o serviço gerido do Google Cloud para o Prometheus para recolher métricas configuradas de terceiros e definidas pelo utilizador e, em seguida, enviá-las para o Cloud Monitoring. O serviço gerido do Google Cloud para Prometheus permite-lhe monitorizar e receber alertas sobre as suas cargas de trabalho através do Prometheus, sem gerir e operar manualmente o Prometheus à escala.
Personalize e melhore a recolha de dados
Por predefinição, o GKE cria um repositório do Logging para armazenar registos de cada cluster. Pode controlar que registos e que métricas, se existirem, são enviados do seu cluster do GKE para o Cloud Logging e o Cloud Monitoring.
Também pode controlar se quer ativar o Google Cloud Managed Service for Prometheus.
Para clusters do GKE Autopilot, não pode desativar a integração do Cloud Monitoring e Cloud Logging.
Métricas de observabilidade adicionais
Pode recolher métricas de observabilidade adicionais ativando um ou mais pacotes de métricas de observabilidade.
- Métricas do plano de controlo: Monitorize o estado dos componentes do Kubernetes recolhendo métricas para o servidor da API Kubernetes, o Scheduler e o Controller Manager. Estas métricas são sinais úteis do estado de funcionamento do serviço para definir objetivos ao nível do serviço (SLOs).
- Métricas de estado do Kube: Monitorize o estado dos objetos do Kubernetes, como implementações, nós e pods.
- Métricas cAdvisor/Kubelet: Monitorize o estado dos contentores e do kubelet.
Métricas de terceiros e definidas pelo utilizador
Para monitorizar aplicações de terceiros em execução nos seus clusters, como o Postgres, o MongoDB e o Redis, use os exportadores do Prometheus com o serviço gerido do Google Cloud para o Prometheus.
Também pode escrever exportadores personalizados para monitorizar outros sinais de estado e desempenho.
Use dados recolhidos
Use os dados que recolhe para analisar o estado de funcionamento das aplicações, depurar, resolver problemas e testar à medida que desenvolve, implementa e mantém as suas aplicações.
O GKE oferece funcionalidades de observabilidade integradas para começar rapidamente:
- Veja os dados recolhidos para os seus clusters e cargas de trabalho nos painéis de controlo de observabilidade do GKE. Pode personalizar os painéis de controlo fornecidos para os seguintes fins: - Veja as principais métricas do cluster, como a utilização da CPU, a utilização da memória e o número de incidentes abertos.
- Veja os clusters pela respetiva infraestrutura, cargas de trabalho ou serviços.
- Inspeção de espaços de nomes, nós, cargas de trabalho, serviços, pods e contentores.
- Para pods e contentores, veja métricas em função do tempo e veja entradas de registo.
 - Também pode criar os seus próprios painéis de controlo ou importar painéis de controlo do Grafana para satisfazer as suas necessidades. 
- No separador Observabilidade, pode criar políticas de alertas recomendadas para receber notificações sobre problemas. Para saber mais sobre os alertas, consulte a vista geral dos alertas. 
- Crie SLOs para monitorizar os objetivos de desempenho do seu serviço através das métricas do GKE recolhidas. 
- Use os playbooks do GKE para resolver problemas comuns, como pods não agendáveis e contentores que falham repetidamente após o reinício. 
- Explore e analise os seus dados com ferramentas como o Explorador de registos, Explorador de métricas e Relatórios de erros. 
- Reveja os registos de auditoria do GKE que registam atividades e acessos administrativos como parte dos registos de auditoria da nuvem. A política de registo de auditoria determina que eventos são registados e se uma entrada de registo pertence a um registo de atividade do administrador ou a um registo de acesso aos dados. 
Outras funcionalidades
O GKE integra-se com outros Google Cloud serviços para ajudar a monitorizar e gerir os seus clusters e cargas de trabalho.
- Use o painel de controlo da postura de segurança para identificar preocupações de segurança com base nas nossas normas e nas práticas recomendadas do setor. 
- Veja estatísticas e recomendações para otimizar os seus grupos. 
- Use o registo de políticas de rede para ajudar a resolver problemas com as políticas de rede do Kubernetes. Se usar o GKE Dataplane V2, o registo da política de rede está integrado. 
Preços
O preço da integração com o Cloud Logging (incluindo os registos de auditoria do Google Cloud), o Cloud Monitoring e o serviço gerido do Google Cloud para Prometheus baseia-se na quantidade de registos e métricas recolhidos. Consulte a página Preços para ver detalhes.
As funcionalidades fornecidas por outros Google Cloud serviços indicados em Outras funcionalidades têm preços separados. Consulte a secção Preços dessas páginas de documentação para obter mais informações.
O que se segue?
- Observe os seus clusters. Saiba como ver painéis de controlo, organizar informações de clusters e ver detalhes de alertas. 
- Ative o registo de auditoria detalhado ao nível do SO nos nós do cluster do GKE e como exportar registos para o Cloud Logging. 
- Para mais informações sobre como usar as funcionalidades de observabilidade para resolver problemas do GKE, consulte os artigos Realize análises históricas com o Cloud Logging e Realize uma monitorização proativa com o Cloud Monitoring.