Bekannte Probleme bei GKE on AWS

Auf dieser Seite werden ausgewählte bekannte Probleme für GKE on AWS und Schritte aufgeführt, die Sie unternehmen können, um ihre Auswirkungen zu verringern.

Zum Filtern der bekannten Probleme nach einer Produktversion oder -kategorie wählen Sie in den folgenden Drop-down-Menüs die gewünschten Filter aus.

Wenn Sie am Google-Entwicklerprogramm teilnehmen, speichern Sie diese Seite, um Benachrichtigungen zu erhalten, wenn eine Versionsanmerkung zu dieser Seite veröffentlicht wird. Weitere Informationen finden Sie unter Gespeicherte Seiten.

Wählen Sie Ihre GKE on AWS-Version aus:

Wählen Sie eine Kategorie für Ihr Problem aus:

Oder suchen Sie nach Ihrem Problem:

Kategorie Identifizierte Version(en) Problem und Problemumgehung
Vorgänge

1.28.0-gke.0 bis 1.28.8-gke.800 (nicht einschließlich)

1.27.0-gke.0 bis 1.27.12-gke.800 (nicht einschließlich)

1.26, 1.25, 1.24, 1.23, 1.22

Cluster Autoscaler skaliert Knotenpools mit benutzerdefinierten Labels oder Markierungen nicht korrekt von null Knoten auf.

Dieses Problem tritt auf, weil der GKE on AWS-Cluster-Autoscaler die Knotenpool-Labels und Taint-Tags während der Knotenpoolbereitstellung nicht für die entsprechende Auto Scaling-Gruppe des Knotenpools konfiguriert hat. Bei Knotenpools mit null Knoten kann der Cluster-Autoscaler die Knotenvorlagen aufgrund dieser fehlenden Tags nicht richtig erstellen. Dies kann zu falschen Skalierungsentscheidungen führen, z. B. wenn Pods nicht auf den entsprechenden Knoten geplant werden oder Knoten bereitgestellt werden, die nicht wirklich benötigt werden.

Weitere Informationen finden Sie unter Auto-Discovery einrichten.

Netzwerk

1.26.0-gke.0 bis 1.26.4-gke.220 (nicht einschließlich)

1.25.0-gke.0 bis 1.25.10-gke.1200 (nicht einschließlich)

1.24 ab 1.24.0-gke.0,

1.23 ab 1.23.8-gke.1700

Bei Clustern, die auf einem Ubuntu-Betriebssystem mit Kernel 5.15 oder höher ausgeführt werden, kann es zu Fehlern beim Einfügen der Tabelle für das Verbindungs-Tracking (conntrack) von Netfilter kommen. Einfügungsfehler können auch dann auftreten, wenn in der Conntrack-Tabelle Platz für neue Einträge ist. Die Fehler werden durch Änderungen am Kernel 5.15 und höher verursacht, die das Einfügen von Tabellen basierend auf der Kettelänge einschränken.

Ob Sie von diesem Problem betroffen sind, können Sie mit folgendem Befehl in den Systemstatistiken des Kernel-Verbindungstrackings überprüfen:

    sudo conntrack -S
    

Die Antwort sieht so aus:

cpu=0       found=0 invalid=4 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=1       found=0 invalid=0 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=2       found=0 invalid=16 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=3       found=0 invalid=13 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=4       found=0 invalid=9 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=5       found=0 invalid=1 insert=0 insert_failed=0 drop=0 early_drop=0
error=519 search_restart=0 clash_resolve=126 chaintoolong=0
    

Wenn ein chaintoolong-Wert in der Antwort eine Zahl ungleich null ist, sind Sie von diesem Problem betroffen.

Workaround:

Wenn Sie Version 1.26.2-gke.1001 verwenden, führen Sie ein Upgrade auf Version 1.26.4-gke.2200 oder höher durch.

Nutzerfreundlichkeit 1.25.5-gke.1500, 1.25.4-gke.1300

Für einige UI-Oberflächen in der Google Cloud -Konsole kann keine Autorisierung für den Cluster erfolgen. Der Cluster wird dann möglicherweise als nicht erreichbar angezeigt.

Workaround:

Aktualisieren Sie Ihren Cluster auf den neuesten verfügbaren Patch der Version 1.25. Dieses Problem wurde in Version 1.25.5-gke.2000 behoben.

Nutzerfreundlichkeit 1.22

Mit Kubernetes 1.22 werden mehrere APIs verworfen und ersetzt. Wenn Sie Ihren Cluster auf Version 1.22 oder höher aktualisiert haben, schlagen alle Aufrufe Ihrer Anwendung an eine der verworfenen APIs fehl.

Workaround:

Führen Sie ein Upgrade Ihrer Anwendung durch, um Aufrufe von verworfenen APIs durch Aufrufe der neueren Gegenstücke zu ersetzen.

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.