Este documento lista os artigos de solução de problemas comuns que você pode encontrar ao usar o Google Kubernetes Engine (GKE). Se você estiver diagnosticando
erros de carga de trabalho, como ImagePullBackOff e CrashLoopBackOff, depurando
o comportamento do escalonamento automático de cluster, resolvendo problemas de PersistentVolume ou
solucionando problemas de registro de nós, os documentos listados aqui podem ajudar.
Este documento é destinado a administradores, arquitetos, especialistas em segurança, Rede ou em armazenamento que resolvem problemas de
configurações do GKE. Para saber mais sobre as funções do GKE,
consulte
Funções e tarefas comuns do usuário do GKE.
Diagnosticar e resolver problemas de clusters do GKE Autopilot, incluindo criação de clusters, exclusão de namespaces, escalonamento e problemas de carga de trabalho.
Resolver problemas da ferramenta de linha de comando kubectl no GKE, incluindo problemas de autenticação e autorização.
Esta página também inclui dicas sobre como
resolver problemas do proxy Konnectivity
para verificar se ele está fazendo com que os comandos kubectl logs, attach,
exec ou port-forward parem de
responder.
Resolver problemas em pools de nós padrão do GKE,
incluindo problemas com a criação de pool de nós, provisionamento de melhor esforço,
metadados de instância corrompidos e migração de cargas de trabalho para novos pools de nós.
Aprenda a diagnosticar e resolver o status NotReady
do nó no GKE solucionando problemas de causas comuns, como
escassez de recursos, problemas de rede e falhas de componentes.
Resolver problemas que ocorrem ao adicionar nós ao cluster
GKE Standard, como falhas no registro de nós
e pré-requisitos ausentes para o registro bem-sucedido de nós.
Diagnosticar e resolver motivos comuns para o cluster não remover nós subutilizados. Saiba como verificar problemas como PodDisruptionBudgets restritivos, pods com armazenamento local ou anotações específicas (por exemplo, "cluster-autoscaler.kubernetes.io/safe-to-evict": "false") que impedem a remoção de nós.
Saiba por que o escalonador automático de cluster não está adicionando novos nós para atender à demanda.
Verifique se há pods não programáveis, se você não atingiu os limites de tamanho do cluster ou do pool de nós e identifique possíveis problemas de cota de recursos ou de disponibilidade regional de VMs.
Resolva problemas com o escalonador automático horizontal de pods que não está escalonando
as réplicas de pod do seu aplicativo. Resolva problemas comuns, como objetos HorizontalPodAutoscaler mal configurados ou problemas com o pipeline de métricas.
Resolva problemas de autenticação no GKE, incluindo problemas
com RBAC, federação de identidade da carga de trabalho para GKE e o servidor de
metadados do GKE.
Se a autoridade certificadora (CA) raiz do cluster vai expirar em breve, saiba como fazer uma rotação de credenciais para evitar que as operações normais do cluster sejam interrompidas.
Resolver problemas de extração de imagens. Saiba o que causa status como
ImagePullBackOff e ErrImagePull
e como resolver esses status corrigindo problemas comuns, como
autenticação e conectividade de rede.
Solucione problemas de eventos CrashLoopBackOff no GKE. Diagnosticar problemas como esgotamento de recursos, configurações incorretas de apps e falhas na sondagem de atividade.
Resolver problemas com eventos de memória insuficiente (OOM) do Kubernetes. Identificar causas, distinguir tipos de eventos e aplicar soluções eficazes para encerramentos por falta de memória (OOM) no nível do contêiner e do nó.
Resolva problemas de upgrade de cluster e nó do GKE, incluindo upgrades longos ou incompletos, upgrades automáticos inesperados, falhas e problemas pós-upgrade.
Para resolver problemas com namespaces travados no estado
Terminating, identifique e remova os componentes
não íntegros que estão impedindo a exclusão.
Resolver problemas de registros ausentes do GKE. Saiba como verificar o status da API, as configurações do cluster, as permissões, as cotas, os filtros e o comportamento do aplicativo.
Solucione alguns dos erros 400, 401, 403 e 404 que você pode
encontrar ao usar o GKE. Esta página também inclui
informações sobre como resolver
erros de permissões de edição ausentes na conta.
Identifique e resolva problemas conhecidos que possam afetar seu uso do GKE.
A seguir
Se você não encontrar uma solução para seu problema na documentação, consulte Receber suporte para mais ajuda, incluindo conselhos sobre os seguintes tópicos:
Receber suporte da comunidade fazendo perguntas no StackOverflow e usando a tag google-kubernetes-engine para pesquisar problemas semelhantes. Você também pode participar do
canal do Slack #kubernetes-engine
para receber mais suporte da comunidade.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-12-05 UTC."],[],[]]