Auf dieser Seite finden Sie Links zu Seiten zur Fehlerbehebung für häufige Probleme, die bei der Verwendung von Google Kubernetes Engine (GKE) auftreten können. Diese Seite richtet sich an Administratoren und Architekten, Sicherheitsspezialisten, Netzwerkspezialisten oder Speicherspezialisten, die Probleme mit GKE-Konfigurationen beheben. Weitere Informationen zu GKE-Rollen finden Sie unter Häufig verwendete GKE-Nutzerrollen und -Aufgaben.
Wenn Sie noch nicht mit der Fehlerbehebung in GKE vertraut sind oder einen allgemeinen Überblick über grundlegende Tools und Techniken benötigen, lesen Sie zuerst Einführung in die Fehlerbehebung.
Informationen zum Diagnostizieren und Beheben von Problemen, die in verschiedenen Phasen der Arbeit mit Ihrer GKE-Infrastruktur auftreten, finden Sie in den folgenden Abschnitten:
Diagnostizieren und beheben Sie Probleme mit GKE Autopilot-Clustern, einschließlich Problemen beim Erstellen von Clustern, beim Löschen von Namespaces, beim Skalieren und bei Arbeitslasten.
Fehlerbehebung für das kubectl-Befehlszeilentool in GKE, einschließlich Problemen mit Authentifizierung und Autorisierung.
Auf dieser Seite finden Sie auch Informationen zur Fehlerbehebung beim Konnectivity-Proxy, um zu prüfen, ob er die Ursache dafür ist, dass die Befehle kubectl logs, attach, exec oder port-forward nicht mehr reagieren.
Fehlerbehebung bei GKE Standard-Knotenpools, einschließlich Problemen beim Erstellen von Knotenpools, Best-Effort-Bereitstellung, beschädigten Instanzmetadaten und der Migration von Arbeitslasten zu neuen Knotenpools.
Hier erfahren Sie, wie Sie Probleme beheben, die beim Hinzufügen von Knoten zu Ihrem GKE Standard-Cluster auftreten können, z. B. Fehler bei der Knotenregistrierung und fehlende Voraussetzungen für die erfolgreiche Knotenregistrierung.
Häufige Gründe dafür, dass in Ihrem Cluster nicht ausgelastete Knoten nicht entfernt werden, ermitteln und beheben Hier erfahren Sie, wie Sie nach Problemen wie restriktiven PodDisruptionBudgets, Pods mit lokalem Speicher oder bestimmten Annotationen (z. B. "cluster-autoscaler.kubernetes.io/safe-to-evict": "false") suchen, die das Entfernen von Knoten verhindern.
Hier erfahren Sie, warum der Cluster Autoscaler keine neuen Knoten hinzufügt, um die Nachfrage zu decken.
Prüfen Sie, ob es Pods gibt, die nicht geplant werden können, ob Sie die Größenlimits für Cluster oder Knotenpools erreicht haben, und ermitteln Sie potenzielle Probleme mit Ressourcenkontingenten oder der regionalen VM-Verfügbarkeit.
Fehlerbehebung bei Problemen mit dem horizontalen Pod-Autoscaler, der die Pod-Replikate Ihrer Anwendung nicht skaliert. Häufige Probleme beheben, z. B. falsch konfigurierte HorizontalPodAutoscaler-Objekte oder Probleme mit der Metrikpipeline.
Fehlerbehebung bei Dienstkonten, einschließlich der Wiederherstellung des Standarddienstkontos und der Aktivierung des Compute Engine-Standarddienstkontos.
Wenn die Stammzertifizierungsstelle (CA) Ihres Clusters bald abläuft, erfahren Sie hier, wie Sie eine Rotation der Anmeldedaten durchführen, um Unterbrechungen des normalen Clusterbetriebs zu vermeiden.
Fehlerbehebung beim Abrufen von Images Hier erfahren Sie, was die Ursachen für Status wie ImagePullBackOff und ErrImagePull sind und wie Sie diese Status beheben können, indem Sie häufige Probleme wie Authentifizierung und Netzwerkverbindung beheben.
Fehlerbehebung bei CrashLoopBackOff-Ereignissen in GKE. Probleme wie Ressourcenerschöpfung, Fehlkonfigurationen von Apps und Fehler bei Aktivitätsprüfungen diagnostizieren
Fehlerbehebung bei Kubernetes-Ereignissen vom Typ „Out of Memory“ (OOM) Ursachen ermitteln, Ereignistypen unterscheiden und effektive Lösungen für OOM-Kills auf Container- und Knotenebene anwenden.
Fehlerbehebung bei TPUs, einschließlich Problemen mit Kontingenten, der automatischen Knotenbereitstellung, der Arbeitslastkonfiguration und der Planung.
Fehlerbehebung und Behebung von Problemen bei GKE-Cluster- und Knotenupgrades, einschließlich langer oder unvollständiger Upgrades, unerwarteter automatischer Upgrades, Fehler und Probleme nach dem Upgrade.
Beheben Sie Probleme mit Namespaces, die im Status Terminating festhängen, indem Sie die fehlerhaften Komponenten, die das Löschen blockieren, identifizieren und entfernen.
Hier erfahren Sie, wie Sie Fehler bei gleichzeitig ausgeführten Vorgängen beheben, indem Sie diese Fehler identifizieren und beheben, indem Sie warten, bis die Vorgänge abgeschlossen sind.
Fehlerbehebung bei Monitoring-Dashboards, einschließlich Problemen beim Aktivieren des Monitorings, fehlenden Kubernetes-Ressourcen und Berechtigungen.
Bekannte Probleme, die sich auf die Verwendung von GKE auswirken können, identifizieren und beheben
Nächste Schritte
Wenn Sie in der Dokumentation keine Lösung für Ihr Problem finden, lesen Sie den Abschnitt Support erhalten. Dort finden Sie weitere Hilfe, z. B. zu den folgenden Themen:
Sie können eine Supportanfrage erstellen, indem Sie sich an den Cloud Customer Care wenden.
Support von der Community erhalten, indem Sie Fragen auf Stack Overflow stellen und mit dem Tag google-kubernetes-engine nach ähnlichen Problemen suchen. Sie können auch dem #kubernetes-engine-Slack-Kanal beitreten, um weiteren Community-Support zu erhalten.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-10-20 (UTC)."],[],[]]