Este documento lista documentos de resolução de problemas para problemas comuns que pode
encontrar quando usa o Google Kubernetes Engine (GKE). Quer esteja a diagnosticar erros de carga de trabalho, como ImagePullBackOff e CrashLoopBackOff, a depurar o comportamento de escalabilidade automática de clusters, a resolver problemas de PersistentVolume ou a resolver problemas de registo de nós, os documentos aqui indicados podem ajudar.
Este documento destina-se a administradores e arquitetos, especialistas em segurança, especialistas em redes ou especialistas em armazenamento que resolvem problemas de configurações do GKE. Para saber mais acerca das funções do GKE,
consulte o artigo
Funções e tarefas comuns de utilizadores do GKE.
Diagnosticar e resolver problemas de clusters do GKE Autopilot, incluindo a criação de clusters, a eliminação de espaços de nomes, o dimensionamento e os problemas de cargas de trabalho.
Resolva problemas da ferramenta de linha de comandos kubectl no GKE, incluindo problemas de autenticação e autorização.
Esta página também inclui sugestões sobre como
resolver problemas do proxy Konnectivity
para verificar se está a fazer com que os comandos kubectl logs, attach,
exec ou port-forward deixem de
responder.
Resolva problemas com conjuntos de nós padrão do GKE,
incluindo problemas com a criação de conjuntos de nós, o aprovisionamento dentro do possível,
metadados de instâncias danificados e a migração de cargas de trabalho para novos conjuntos de nós.
Saiba como diagnosticar e resolver o estado do nó no GKE resolvendo causas comuns, como escassez de recursos, problemas de rede e falhas de componentes.NotReady
Resolva problemas que ocorrem quando adiciona nós ao seu cluster padrão do GKE, como falhas de registo de nós e pré-requisitos em falta para o registo de nós bem-sucedido.
Diagnostique e resolva os motivos comuns pelos quais o cluster não está a remover os nós subutilizados. Saiba como verificar se existem problemas como
PodDisruptionBudgetsrestrições, pods com armazenamento local ou anotações específicas
(por exemplo, "cluster-autoscaler.kubernetes.io/safe-to-evict": "false")
que impedem a remoção de nós.
Saiba por que motivo o redimensionador automático de clusters não está a adicionar novos nós para satisfazer a procura.
Verifique se existem pods não agendáveis, certifique-se de que não atingiu os limites de tamanho do cluster ou do conjunto de nós e identifique potenciais problemas de quota de recursos ou de disponibilidade de VMs regionais.
Resolva problemas com o redimensionador automático de pods horizontal que não dimensiona
as réplicas de pods da sua aplicação. Resolva problemas comuns, como:
Objetos HorizontalPodAutoscaler configurados incorretamente ou problemas com o pipeline de métricas.
Resolva problemas de autenticação no GKE, incluindo problemas
com o RBAC, a federação de identidades da carga de trabalho para o GKE e o servidor de metadados
do GKE.
Resolva problemas de contas de serviço, incluindo a restauração da conta de serviço predefinida e a ativação da conta de serviço predefinida do Compute Engine.
Se a autoridade de certificação (AC) raiz do seu cluster expirar em breve, saiba
como fazer uma rotação de credenciais
para evitar a interrupção das operações normais do cluster.
Resolva problemas de obtenção de imagens. Saiba o que causa estados como
ImagePullBackOff e ErrImagePull
e como resolver estes estados corrigindo problemas comuns, como
a autenticação e a conetividade de rede.
Resolva problemas de eventos CrashLoopBackOff no GKE. Diagnosticar problemas como esgotamento de recursos, configurações incorretas da app e falhas de sondagem de atividade.
Resolva problemas de eventos de falta de memória (OOM) do Kubernetes. Identificar causas,
distinguir tipos de eventos e aplicar soluções eficazes para eliminações por falta de memória (OOM) ao nível do contentor e do nó.
Resolva problemas com as TPUs, incluindo problemas com a quota, o aprovisionamento automático de nós, a configuração da carga de trabalho e a programação.
Resolva problemas de atualização de nós e clusters do GKE, incluindo atualizações longas ou incompletas, atualizações automáticas inesperadas, falhas e problemas pós-atualização.
Resolva problemas com espaços de nomes bloqueados no estado Terminating identificando e removendo os componentes não íntegros que estão a bloquear a eliminação.
Resolva problemas com os painéis de controlo de monitorização, incluindo problemas com a ativação da
monitorização, recursos do Kubernetes em falta e autorizações.
Resolva problemas de registos do GKE em falta. Saiba como verificar o estado da API, as definições do cluster, as autorizações, as quotas, os filtros e o comportamento da aplicação.
Identifique e resolva problemas conhecidos que possam
afetar a sua utilização do GKE.
O que se segue?
Se não conseguir encontrar uma solução para o seu problema na documentação, consulte a secção
Obtenha apoio técnico para receber mais ajuda,
incluindo aconselhamento sobre os seguintes tópicos:
Abrindo um registo de apoio técnico através do contacto com o Cloud Customer Care.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-12-05 UTC."],[],[]]