Ce document répertorie les documents de dépannage pour les problèmes courants que vous pouvez rencontrer lorsque vous utilisez Google Kubernetes Engine (GKE). Que vous diagnostiquiez des erreurs de charge de travail telles que ImagePullBackOff et CrashLoopBackOff, que vous déboguiez le comportement d'autoscaling du cluster, que vous résolviez des problèmes de PersistentVolume ou que vous résolviez des problèmes d'enregistrement de nœuds, les documents répertoriés ici peuvent vous aider.
Ce document est destiné aux administrateurs et aux architectes, aux spécialistes de la sécurité, aux spécialistes de la mise en réseau ou aux spécialistes du stockage qui résolvent les problèmes liés aux configurations GKE. Pour en savoir plus sur les rôles GKE,
consultez
la section Rôles utilisateur et tâches courantes de GKE.
Diagnostiquez et résolvez les problèmes liés aux clusters GKE Autopilot, y compris la création de clusters, la suppression d'espaces de noms, le scaling et les problèmes de charge de travail.
Résolvez les problèmes liés aux pools de nœuds GKE Standard,
y compris les problèmes liés à la création de pools de nœuds, au provisionnement au mieux,
aux métadonnées d'instance corrompues et à la migration des charges de travail vers de nouveaux pools de nœuds.
Découvrez comment diagnostiquer et résoudre l'état du nœud NotReady
dans GKE en résolvant les causes courantes telles que
les pénuries de ressources, les problèmes de réseau et les défaillances de composants.
Résolvez les problèmes qui se produisent lorsque vous ajoutez des nœuds à votre
cluster GKE Standard, tels que les échecs d'enregistrement de nœuds et les conditions préalables manquantes pour un enregistrement réussi des nœuds.
Résolvez les problèmes liés aux environnements d'exécution de conteneurs dans GKE, y compris
les problèmes liés à containerd et dockershim, et
aux registres privés.
Diagnostiquez et résolvez les raisons courantes pour lesquelles votre cluster ne supprime pas les nœuds sous-utilisés. Découvrez comment vérifier les problèmes tels que les
PodDisruptionBudgets, les pods avec stockage local ou les annotations spécifiques
(par exemple, "cluster-autoscaler.kubernetes.io/safe-to-evict": "false")
qui empêchent l'éviction des nœuds.
Découvrez pourquoi l'autoscaler de cluster n'ajoute pas de nouveaux nœuds pour répondre à la demande.
Recherchez les pods non planifiables, vérifiez que vous n'avez pas atteint les limites de taille du cluster ou du pool de nœuds
et identifiez les problèmes potentiels de quota de ressources ou de disponibilité régionale des VM.
Résolvez les problèmes liés à l'Autoscaler horizontal de pods qui n'effectue pas de scaling
des répliques de pods de votre application. Résolvez les problèmes courants, tels que
les objets HorizontalPodAutoscaler mal configurés ou les problèmes liés au pipeline de métriques
Résolvez les problèmes de stockage, y compris les problèmes liés aux disques persistants régionaux,
aux performances des disques et à l'expansion des volumes.
Résolvez les problèmes d'authentification dans GKE, y compris les problèmes liés au contrôle d'accès basé sur les rôles (RBAC), à Workload Identity Federation for GKE et au serveur de métadonnées GKE.
Résolvez les problèmes liés aux comptes de service, y compris la restauration du compte de service par défaut
et l'activation du compte de service Compute Engine par défaut.
Si l'autorité de certification racine de votre cluster arrive bientôt à expiration, découvrez
comment effectuer une rotation des identifiants
pour éviter que les opérations normales du cluster ne soient interrompues.
Résolvez les problèmes liés aux extractions d'images. Découvrez les causes des états tels que
ImagePullBackOff et ErrImagePull
et comment résoudre ces états en corrigeant les problèmes courants tels que
l'authentification et la connectivité réseau.
Résolvez les problèmes liés aux événements CrashLoopBackOff dans
GKE. Diagnostiquez les problèmes tels que l'épuisement des ressources, les erreurs de configuration des applications et les échecs de sonde de vivacité.
Résolvez les problèmes liés aux événements Kubernetes Out Of Memory (OOM). Identifiez les causes,
distinguez les types d'événements et appliquez des solutions efficaces pour les suppressions OOM au niveau du conteneur
et du nœud.
Résolvez les problèmes liés aux TPU, y compris les problèmes liés aux quotas, au provisionnement automatique des nœuds
, à la configuration des charges de travail et à la planification.
Résolvez les problèmes liés aux GPU, y compris les problèmes liés à l'installation des pilotes de GPU,
aux erreurs de plug-in d'appareil et aux images de conteneurs.
Résolvez les problèmes liés aux mises à niveau des clusters et des nœuds GKE
, y compris les mises à niveau longues ou incomplètes, les mises à niveau automatiques inattendues
, les échecs et les problèmes post-mise à niveau.
Résolvez les problèmes liés aux espaces de noms bloqués à l'état
Terminating en identifiant et en supprimant les composants non opérationnels
qui bloquent la suppression.
Résolvez les problèmes liés aux tableaux de bord Monitoring, y compris les problèmes liés à l'activation
de la surveillance, aux ressources Kubernetes manquantes et aux autorisations.
Résolvez les problèmes liés aux journaux GKE manquants. Découvrez comment vérifier l'état de l'API
, les paramètres du cluster, les autorisations, les quotas, les filtres et le comportement des applications.
Identifiez et résolvez les problèmes connus qui peuvent affecter votre utilisation de GKE.
Étape suivante
Si vous ne trouvez pas de solution à votre problème dans la documentation, consultez Obtenir de l'aide pour bénéficier d'une assistance supplémentaire, y compris des conseils sur les sujets suivants :
Obtenir de l'aide de la communauté en posant des questions sur Stack Overflow et en utilisant le tag google-kubernetes-engine pour rechercher des problèmes similaires. Vous pouvez également rejoindre le
#kubernetes-engine canal Slack
pour obtenir une assistance supplémentaire de la communauté.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2026/05/21 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2026/05/21 (UTC)."],[],[]]