Nesta página, listamos páginas de solução de problemas comuns que você pode
encontrar ao usar o Google Kubernetes Engine (GKE). Esta página é destinada a
administradores e arquitetos, especialistas em segurança, especialistas Rede ou
especialistas em armazenamento que resolvem problemas de configurações do GKE. Para
saber mais sobre as funções do GKE, consulte
Tarefas e funções de usuário comuns do GKE.
Se você não tem experiência em solução de problemas no GKE ou quer uma visão geral de alto nível das ferramentas e técnicas fundamentais, comece com Introdução à solução de problemas.
Para diagnosticar e resolver problemas encontrados em várias etapas do trabalho
com sua infraestrutura do GKE, consulte as seções a seguir:
Diagnosticar e resolver problemas de clusters do GKE Autopilot, incluindo criação de clusters, exclusão de namespaces, escalonamento e problemas de carga de trabalho.
Resolver problemas da ferramenta de linha de comando kubectl no GKE, incluindo problemas de autenticação e autorização.
Esta página também inclui dicas sobre como
resolver problemas do proxy Konnectivity
para verificar se ele está fazendo com que os comandos kubectl logs, attach,
exec ou port-forward parem de
responder.
Resolver problemas em pools de nós padrão do GKE,
incluindo problemas com a criação de pool de nós, provisionamento de melhor esforço,
metadados de instância corrompidos e migração de cargas de trabalho para novos pools de nós.
Resolver problemas que ocorrem ao adicionar nós ao cluster GKE Standard, como falhas no registro de nós e pré-requisitos ausentes para o registro bem-sucedido de nós.
Diagnosticar e resolver motivos comuns para o cluster não remover nós subutilizados. Saiba como verificar problemas como
PodDisruptionBudgets restritivos, pods com armazenamento local ou anotações específicas
(por exemplo, "cluster-autoscaler.kubernetes.io/safe-to-evict": "false")
que impedem a remoção de nós.
Saiba por que o escalonador automático de cluster não está adicionando novos nós para atender à demanda.
Verifique se há pods não programáveis, se você não atingiu os limites de tamanho do cluster ou do pool de nós e identifique possíveis problemas de cota de recursos ou de disponibilidade regional de VMs.
Resolva problemas com o escalonador automático horizontal de pods que não está escalonando
as réplicas de pod do seu aplicativo. Resolva problemas comuns, como objetos HorizontalPodAutoscaler mal configurados ou problemas com o pipeline de métricas.
Resolva problemas de autenticação no GKE, incluindo problemas
com RBAC, federação de identidade da carga de trabalho para GKE e o servidor de
metadados do GKE.
Se a autoridade certificadora (CA) raiz do cluster expirar em breve, saiba como fazer uma rotação de credenciais para evitar que as operações normais do cluster sejam interrompidas.
Resolva problemas de extração de imagens. Saiba o que causa status como
ImagePullBackOff e ErrImagePull
e como resolver esses status corrigindo problemas comuns, como
autenticação e conectividade de rede.
Solucione problemas de eventos CrashLoopBackOff no GKE. Diagnosticar problemas como esgotamento de recursos, configurações incorretas de apps e falhas na sondagem de atividade.
Resolver problemas com eventos de memória insuficiente (OOM) do Kubernetes. Identificar causas, distinguir tipos de eventos e aplicar soluções eficazes para encerramentos por falta de memória (OOM) no nível do contêiner e do nó.
Resolva problemas de upgrade de cluster e nó do GKE, incluindo upgrades longos ou incompletos, upgrades automáticos inesperados, falhas e problemas pós-upgrade.
Para resolver problemas com namespaces travados no estado
Terminating, identifique e remova os componentes
não íntegros que estão impedindo a exclusão.
Solucione alguns dos erros 400, 401, 403 e 404 que você pode
encontrar ao usar o GKE. Esta página também inclui
informações sobre como resolver
erros de permissões de edição ausentes na conta.
Identifique e resolva problemas conhecidos que possam afetar seu uso do GKE.
A seguir
Se você não encontrar uma solução para seu problema na documentação, consulte Receber suporte para mais ajuda, incluindo conselhos sobre os seguintes tópicos:
Receber suporte da comunidade fazendo perguntas no StackOverflow e usando a tag google-kubernetes-engine para pesquisar problemas semelhantes. Você também pode participar do
canal do Slack #kubernetes-engine
para receber mais suporte da comunidade.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-10-20 UTC."],[],[]]