In diesem Dokument wird beschrieben, wie Sie Surge-Updates von Knotenpools aktivieren und verwalten. Informationen zur Funktionsweise von Surge-Updates von Knotenpools finden Sie unter Surge-Updates.
Was Sie vor der Ausführung von Surge-Updates beachten sollten
Beachten Sie vor der Ausführung eines Surge-Updates Folgendes:
- Die zusätzlichen Instanzen, die im Rahmen dieses Surge-Schritts erstellt werden, können Ihr AWS-Instanzkontingent überschreiten. Wenn Sie nicht genügend Kontingent haben und diese zusätzlichen Instanzen nicht bereitgestellt werden können, schlägt das Update möglicherweise fehl.
- Wenn
max-unavailable-updateauf 0 festgelegt ist, können trotzdem Störungen bei Arbeitslasten auftreten, da Pods entfernt und auf den neueren Knoten neu geplant werden. - Die maximale Anzahl von Knoten, die gleichzeitig aktualisiert werden können, entspricht der Summe von
max-surge-updateundmax-unavailable-updateund ist auf 20 begrenzt.
Surge-Updates aktivieren und konfigurieren
Wenden Sie sich an
Google Cloud den Support, um Surge-Updates zu aktivieren. Nachdem das Supportteam die Funktion aktiviert hat, können Sie beim Erstellen oder Aktualisieren Ihres Knotenpools Werte für die Parameter max-surge-update und max-unavailable-update zuweisen:
Erstellen
gcloud container aws node-pools create NODE_POOL_NAME
--cluster CLUSTER_NAME \
--location GOOGLE_CLOUD_LOCATION \
--max-surge-update MAX_SURGE \
--max-unavailable-update MAX_UNAVAILABLE
Aktualisieren
gcloud container aws node-pools update NODE_POOL_NAME
--cluster CLUSTER_NAME \
--location GOOGLE_CLOUD_LOCATION \
--max-surge-update MAX_SURGE \
--max-unavailable-update MAX_UNAVAILABLE
Ersetzen Sie Folgendes:
NODE_POOL_NAME: Der Name des zu aktualisierenden Knotenpools.CLUSTER_NAME: Der Name des Clusters.GOOGLE_CLOUD_LOCATION: die unterstützte Google Cloud Region , in der Ihr Cluster verwaltet wird. Beispiel:us-west1.MAX_SURGE: Die maximale Anzahl zusätzlicher Knoten, die während eines Updates vorübergehend über die aktuelle Größe des Knotenpools hinaus erstellt werden können. Durch Anpassen dieses Werts können Sie steuern, wie viele Knoten gleichzeitig aktualisiert werden. Die Standardeinstellung ist 1, Sie können sie aber auch auf 0 festlegen. Wenn Siemax-surge-updateauf einen Wert größer als 0 festlegen, erstellt GKE on AWS Surge-Knoten. Wenn Sie den Wert auf 0 festlegen, werden keine Surge-Knoten erstellt.MAX_UNAVAILABLE: Die maximale Anzahl von Knoten, die während des Aktualisierungsvorgangs gleichzeitig nicht verfügbar sein können. Wenn Sie diesen Wert erhöhen, können mehr Knoten gleichzeitig aktualisiert werden. Der Standardwert ist 0, kann aber nach oben angepasst werden.
Surge-Update-Einstellungen für einen Knotenpool prüfen
Führen Sie den folgenden Befehl aus, um die Surge-Update-Einstellungen eines Knotenpools aufzurufen:
gcloud alpha container aws node-pools describe NODE_POOL_NAME
--cluster CLUSTER_NAME \
--location GOOGLE_CLOUD_LOCATION \
Ersetzen Sie Folgendes:
NODE_POOL_NAME: Der Name des Knotenpools.CLUSTER_NAME: Der Name des Clusters.GOOGLE_CLOUD_LOCATION: die unterstützte Google Cloud Region , in der Ihr Cluster verwaltet wird. Beispiel:us-west1.
Wenn für den Knotenpool Surge-Updates aktiviert sind, enthält die Ausgabe dieses Befehls einen Abschnitt mit dem Label surge_settings. In diesem Abschnitt surge_settings werden die Werte der Parameter max_surge und max_unavailable angezeigt.
Laufende Surge-Updates verwalten
Sie können ein laufendes Surge-Update abbrechen, ein Rollback eines fehlgeschlagenen Surge-Updates durchführen oder ein unterbrochenes Update fortsetzen.
Surge-Update abbrechen (pausieren) und fortsetzen
In GKE on AWS bedeutet das Abbrechen eines Surge-Updates, dass es pausiert wird. Weitere Informationen zum Abbrechen eines Updates finden Sie unter Aktualisierungsvorgang abbrechen.
Das Abbrechen eines Surge-Updates führt also nicht zu einem Rollback des Updates. Stattdessen kann der Knotenpool in einem teilweise aktualisierten Zustand mit zwei Autoscaling-Gruppen verbleiben: eine mit Knoten, auf denen die vorherige Konfiguration ausgeführt wird, und eine mit Knoten, auf denen die neue Konfiguration ausgeführt wird. Um dieses Problem zu beheben, setzen Sie das Surge-Update fort, indem Sie den Update-Befehl noch einmal ausführen und dabei dieselben Zielparameter wie beim unterbrochenen Vorgang verwenden. Das Starten eines Updates mit anderen Knotenpoolparametern ist erst möglich, wenn das vorherige Update abgeschlossen ist.
Rollback eines fehlgeschlagenen Surge-Updates durchführen
Sie können einen Knotenpool auf seinen ursprünglichen Zustand zurücksetzen, wenn ein Surge-Update abgebrochen wurde oder fehlgeschlagen ist.
Was Sie vor dem Rollback eines Surge-Updates beachten sollten
- Sie können nur ein Rollback für einen Knotenpool mit aktivierten Surge-Updates durchführen, der sich in einem teilweise aktualisierten Zustand (oder im Status
DEGRADED) befindet. - Sobald ein Rollback für einen Knotenpool gestartet wurde, kann es nicht mehr abgebrochen werden.
- Sie können keine weiteren Aktualisierungsvorgänge ausführen, bis das Rollback erfolgreich abgeschlossen wurde.
- Sie können ein Rollback nur wiederholen, wenn es fehlschlägt.
- Sie können für Knotenpools kein Rollback mehr durchführen, nachdem sie erfolgreich aktualisiert worden sind.
Rollback eines fehlgeschlagenen Surge-Updates durchführen
Führen Sie den folgenden Befehl aus, um ein Rollback eines fehlgeschlagenen Updates für den Knotenpool durchzuführen:
gcloud container aws node-pools rollback NODE_POOL_NAME
--cluster CLUSTER_NAME
Ersetzen Sie Folgendes:
NODE_POOL_NAME: Der Name des zu aktualisierenden Knotenpools.CLUSTER_NAME: Der Name des Clusters.
Funktionsweise des Rollbacks
Wenn Sie ein Rollback starten, wird intern ein neuer Aktualisierungsvorgang für den Knotenpool gestartet. „Intern“ bedeutet hier, dass dieser Vorgang innerhalb des Systems selbst ausgeführt wird und keine Eingriffe von Ihnen erfordert. Der Vorgang setzt die Knoten des Knotenpools nach Möglichkeit auf ihren ursprünglichen Zustand zurück.
Die Knoten der alten Autoscaling-Gruppe werden wieder aktiviert und das Autoscaling des Clusters für diese Gruppe wird aktiviert, damit Arbeitslasten auf den Knoten geplant werden können. Teilweise aktualisierte Knotenpoolknoten in der neuen Autoscaling-Gruppe werden deaktiviert, geleert und beendet. Dabei werden die Surge-Einstellungen verwendet, die Sie bei Ihrem ersten Versuch für das Surge-Update festgelegt haben.
Fehlgeschlagene Surge-Updates verwalten
Sie haben drei Möglichkeiten, ein fehlgeschlagenes Update zu beheben:
- Update fortsetzen: Sie können das fehlgeschlagene Update mit denselben Knotenpool-Zieleinstellungen wie beim ersten erfolglosen Versuch fortsetzen.
- Rollback: Verwenden Sie den Rollback-Befehl, um den Knotenpool auf seinen ursprünglichen Zustand zurückzusetzen.
- Ändern und neu starten: Wenn Sie die Parameter für das Surge-Update ändern möchten, muss der vorhandene Knotenpool gelöscht und dann mit den neuen Einstellungen neu erstellt werden. Eine Anleitung zum Löschen eines Knoten pools finden Sie unter Knotenpool löschen.