Esta página apresenta páginas de resolução de problemas para problemas comuns que pode
encontrar quando usa o Google Kubernetes Engine (GKE). Esta página destina-se a
administradores e arquitetos, especialistas em segurança, especialistas em redes ou
especialistas em armazenamento que resolvem problemas de configurações do GKE. Para saber mais sobre as funções do GKE, consulte o artigo Funções e tarefas comuns de utilizadores do GKE.
Se não tem experiência na resolução de problemas no GKE ou quer uma vista geral de alto nível das ferramentas e técnicas fundamentais, comece com a Introdução à resolução de problemas.
Para diagnosticar e resolver problemas que encontrar em várias fases do trabalho com a sua infraestrutura do GKE, consulte as seguintes secções:
Diagnosticar e resolver problemas de clusters do GKE Autopilot, incluindo a criação de clusters, a eliminação de espaços de nomes, o dimensionamento e os problemas de cargas de trabalho.
Resolva problemas da ferramenta de linha de comandos kubectl no GKE, incluindo problemas de autenticação e autorização.
Esta página também inclui sugestões sobre como
resolver problemas do proxy Konnectivity
para verificar se está a fazer com que os comandos kubectl logs, attach,
exec ou port-forward deixem de
responder.
Resolva problemas com conjuntos de nós padrão do GKE,
incluindo problemas com a criação de conjuntos de nós, o aprovisionamento dentro do possível,
metadados de instâncias danificados e a migração de cargas de trabalho para novos conjuntos de nós.
Resolva problemas que ocorrem quando adiciona nós ao seu cluster padrão do GKE, como falhas de registo de nós e pré-requisitos em falta para o registo de nós bem-sucedido.
Diagnostique e resolva os motivos comuns pelos quais o cluster não está a remover os nós subutilizados. Saiba como verificar se existem problemas como
PodDisruptionBudgets, pods com armazenamento local ou anotações específicas
(por exemplo, "cluster-autoscaler.kubernetes.io/safe-to-evict": "false")
que impedem a remoção de nós.
Saiba por que motivo o redimensionador automático de clusters não está a adicionar novos nós para satisfazer a procura.
Verifique se existem pods não agendáveis, certifique-se de que não atingiu os limites de tamanho do cluster ou do conjunto de nós e identifique potenciais problemas de quota de recursos ou de disponibilidade de VMs regionais.
Resolva problemas com o redimensionador automático de pods horizontal que não dimensiona as réplicas de pods da sua aplicação. Resolva problemas comuns, como:
Objetos HorizontalPodAutoscaler configurados incorretamente ou problemas com o pipeline de métricas.
Resolva problemas de autenticação no GKE, incluindo problemas
com o RBAC, a federação de identidades da carga de trabalho para o GKE e o servidor de metadados
do GKE.
Resolva problemas de contas de serviço, incluindo a reposição da conta de serviço predefinida e a ativação da conta de serviço predefinida do Compute Engine.
Se a autoridade de certificação (AC) raiz do seu cluster expirar em breve, saiba
como fazer uma rotação de credenciais
para evitar a interrupção das operações normais do cluster.
Resolva problemas de obtenção de imagens. Saiba o que causa estados como
ImagePullBackOff e ErrImagePull
e como resolver estes estados corrigindo problemas comuns, como
autenticação e conetividade de rede.
Resolva problemas de eventos CrashLoopBackOff no GKE. Diagnostique problemas como o esgotamento de recursos, as configurações incorretas das apps e as falhas de sondagem de atividade.
Resolva problemas de eventos de falta de memória (OOM) do Kubernetes. Identifique as causas,
distinga os tipos de eventos e aplique soluções eficazes para eliminações por falta de memória (OOM) ao nível do contentor e do nó.
Resolva problemas com as TPUs, incluindo problemas com a quota, o aprovisionamento automático de nós, a configuração da carga de trabalho e a programação.
Resolva problemas de atualização de nós e clusters do GKE, incluindo atualizações longas ou incompletas, atualizações automáticas inesperadas, falhas e problemas pós-atualização.
Resolva problemas com espaços de nomes bloqueados no estado Terminating identificando e removendo os componentes não íntegros que estão a bloquear a eliminação.
Resolva problemas com painéis de controlo de monitorização, incluindo problemas com a ativação da
monitorização, recursos do Kubernetes em falta e autorizações.
Identifique e resolva problemas conhecidos que possam
afetar a sua utilização do GKE.
O que se segue?
Se não conseguir encontrar uma solução para o seu problema na documentação, consulte a secção
Obtenha apoio técnico para receber mais ajuda,
incluindo aconselhamento sobre os seguintes tópicos:
Abrindo um registo de apoio técnico através do contacto com o Cloud Customer Care.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-10-20 UTC."],[],[]]