In diesem Dokument wird das Konzept von Cluster-Unterbrechungsbudgets vorgestellt und es wird erläutert, wie Sie sie optional an die Anforderungen Ihrer Umgebung anpassen können. Cluster-Unterbrechungsbudgets sind ein Tool in einer Reihe von Funktionen, mit denen Plattformadministratoren Unterbrechungen von Arbeitslasten minimieren und gleichzeitig Leistung, Zuverlässigkeit und Sicherheit verbessern können.
Cluster-Upgrades, bei denen GKE die Version aktualisiert, die von der Steuerungsebene und den Knoten Ihres Clusters verwendet wird, können eine primäre Quelle für Störungen in einem GKE-Cluster sein. Weitere Informationen zu Upgrades finden Sie unter GKE-GKE-ClusterClusterupgrades. Informationen zu allen anderen Funktionen, mit denen Unterbrechungen bei Clusterupgrades minimiert werden können, finden Sie in diesem Dokument im Abschnitt Clusterupgrades steuern. Weitere allgemeine Informationen zu Änderungen am Clusterlebenszyklus, die über Clusterupgrades hinausgehen, finden Sie unter Änderungen am Clusterlebenszyklus verwalten, um Unterbrechungen zu minimieren.
Was ist ein Budget für Clusterstörungen?
Damit Ihr Cluster nicht zu häufig durch automatische Upgrades unterbrochen wird, wendet GKE standardmäßig ein Budget für Clusterunterbrechungen an, um ein Mindestintervall zwischen automatischen Upgrades der Cluster-Steuerungsebene festzulegen. GKE wendet dieses Budget auch zwischen der Clustererstellung und dem ersten automatischen Upgrade der Steuerungsebene an. Wenn Sie die Cluster-Steuerungsebene manuell aktualisieren, berücksichtigt GKE das Budget für Clusterunterbrechungen beim nächsten automatischen Upgrade. Sie können den Cluster jederzeit manuell aktualisieren, auch wenn dieses Upgrade das Budget für Clusterunterbrechungen überschreitet.
In einem Cluster aktualisiert GKE die Steuerungsebene automatisch vor den Knoten. Mit diesem Budget wird auch die Mindesthäufigkeit von automatischen Clusterknoten-Upgrades festgelegt.
GKE hat standardmäßige Budgets für Clusterunterbrechungen für verschiedene Arten von Versionsupgrades:
- Upgrades der Patchversionen: 24 Stunden
- Upgrades von Nebenversionen: 30 Tage
GKE wendet das Budget auf dieselben Arten von Upgrades an. GKE wartet beispielsweise 24 Stunden, bevor ein Cluster zwischen den Patch-Versionen 1.35.0-gke.1403000 und 1.35.0-gke.1624000 aktualisiert wird, und 30 Tage zwischen 1.34 und 1.35. GKE wartet jedoch 24 Stunden nach einem untergeordneten Upgrade, bevor ein Patch-Upgrade durchgeführt wird.
GKE verwendet ein Budget für Clusterunterbrechungen nur für Clusterupgrades und nicht für andere Arten von Änderungen an einem GKE-Cluster.
Das Budget für Clusterstörungen ist unabhängig von Wartungsfenstern und -ausschlüssen, kann aber gut mit ihnen kombiniert werden. Mit Wartungsrichtlinien wird gesteuert, wann GKE-Clusterwartungen durchgeführt werden dürfen und wann nicht. Mit dem Budget für Clusterunterbrechungen wird ein bestimmtes Zeitintervall zwischen Clusterupgrades festgelegt.
Wann Sie das Budget für Clusterstörungen anpassen sollten
Die Standardbudgets für Clusterunterbrechungen in GKE spiegeln ein Gleichgewicht zwischen der Aktualität von Upgrades wider und vermeiden gleichzeitig aufeinanderfolgende Upgrades und optimieren die Stabilität. Diese allgemeinen Werte sind jedoch möglicherweise nicht ideal für Ihre Clusterumgebung.
Wenn Sie diese Mindestzeit zwischen automatischen Clusterupgrades steuern möchten, können Sie das Cluster-Unterbrechungsbudget konfigurieren. Betrachten Sie beispielsweise die folgenden Szenarien:
- Sie haben einen benutzerdefinierten Prozess zum Bewerten einer GKE-Patchversion für die Steuerungsebene, bevor Sie die Version in die Produktion übertragen. Dieser Prozess dauert länger als das Standard-Clusterbudget.
- Sie haben große Cluster, für die es länger dauert, alle Knotenpools zu aktualisieren. Sie möchten die Versionen in diesen Knotenpools relativ konsistent halten. Sie verringern also die Häufigkeit von Patch-Upgrades und führen monatliche Upgrades durch. Gleichzeitig ermöglichen Sie häufige Wartungsfenster, um sicherzustellen, dass Knotenpool-Upgrades rechtzeitig abgeschlossen werden.
Budget für Clusterunterbrechungen für automatische Upgrades festlegen
Wenn Sie das Intervall zwischen zwei untergeordneten Upgrades oder zwei Patch-Upgrades steuern möchten, können Sie eigene Budgets für Clusterunterbrechungen festlegen. Wir empfehlen jedoch, zuerst ein Wartungsfenster zu konfigurieren, um eine wiederkehrende Zeit für die Wartung von GKE-Cluster festzulegen. Anschließend können Sie das Intervall zwischen Upgrades optional mit dem Budget für Clusterunterbrechungen anpassen.
Wir empfehlen, das Budget für Clusterunterbrechungen zusammen mit den anderen verfügbaren Tools zu verwenden, die GKE zum Steuern von Clusterupgrades bietet. Diese Einstellungen, die mit allen anderen Upgrade-Tools funktionieren, wirken sich nur auf den Zeitpunkt aus, zu dem GKE einen Cluster automatisch auf eine neue Version aktualisiert. GKE hält sich weiterhin an Wartungsfenster und ‑ausschlüsse, folgt der Reihenfolge einer Rollout-Sequenz und wendet alle anderen Standardverfahren an, die normalerweise für automatische Upgrades verwendet werden.
Das Standardbudget für Clusterunterbrechungen beträgt 24 Stunden für Patch-Upgrades und 30 Tage für Nebenversionsupgrades. Sie können die Intervalle für einen beliebigen Zeitraum zwischen 0 und 90 Tagen konfigurieren. Beachten Sie jedoch Folgendes, wenn Sie diese Werte aktualisieren:
- Wir empfehlen, das Intervall für Patch-Upgrades nicht auf mehr als 30 Tage festzulegen, es sei denn, Sie haben einen bestimmten Prozess zur Versionsqualifizierung, der länger dauert. Wenn Sie weniger als alle 30 Tage ein Upgrade durchführen, verpassen Sie möglicherweise wichtige Patches.
- Wir empfehlen, kleinere Upgrades so oft wie möglich zuzulassen, sofern dies für Ihre Clusterumgebung akzeptabel ist. Wenn Sie das Intervall für Nebenversionsupgrades auf maximal 90 Tage festlegen, steigt die Wahrscheinlichkeit, dass GKE Ihren Cluster von der Nebenversion aktualisieren muss, wenn diese das Ende des Supports erreicht. GKE hält sich bei Nebenversionsupgrades, die sieben Tage dauern, an ein separates Budget für Clusterunterbrechungen, wenn eine Nebenversion das Ende des Supports erreicht. Von Ihnen konfigurierte Budgets für Clusterunterbrechungen werden nicht berücksichtigt. Weitere Informationen finden Sie unter Automatische Upgrades am Ende des Supports.
- Wir empfehlen, das Intervall für Patch-Upgrades auf einen kürzeren Zeitraum als das Intervall für untergeordnete Upgrades festzulegen.
Hinweise
Führen Sie die folgenden Aufgaben aus, bevor Sie beginnen:
- Aktivieren Sie die Google Kubernetes Engine API. Google Kubernetes Engine API aktivieren
- Wenn Sie die Google Cloud CLI für diesen Task verwenden möchten, müssen Sie die gcloud CLI installieren und dann initialisieren. Wenn Sie die gcloud CLI bereits installiert haben, rufen Sie die neueste Version mit dem Befehl
gcloud components updateab. In früheren gcloud CLI-Versionen werden die Befehle in diesem Dokument möglicherweise nicht unterstützt.
Budget für Clusterstörungen konfigurieren
Falls Sie dies noch nicht getan haben, empfehlen wir Ihnen, zuerst ein Wartungsfenster zu konfigurieren.
Verwenden Sie dann die folgenden Flags, um ein benutzerdefiniertes Budget für Clusterunterbrechungen festzulegen, wenn Sie einen Cluster mit der gcloud CLI erstellen oder aktualisieren:
- Geringfügige Upgrades:
--maintenance-minor-version-disruption-interval=MINOR_INTERVAL - Patch-Upgrades:
--maintenance-patch-version-disruption-interval=PATCH_INTERVAL
Ersetzen Sie bei diesen Flags MINOR_INTERVAL bzw. PATCH_INTERVAL durch eine Dauer in Sekunden zwischen 0 Tagen (0s) und 90 Tagen (7776000s).
Sie können diese Flags in den folgenden Situationen verwenden:
- Cluster erstellen:
- Autopilot:
gcloud container clusters create-auto - Standard:
gcloud container cluster create
- Autopilot:
- Cluster aktualisieren:
gcloud container cluster update
Sie können die Flags gleichzeitig oder unabhängig voneinander verwenden.
Unterbrechungsbudget für den Cluster auf die Standardwerte zurücksetzen
Wenn Sie das Budget für Clusterunterbrechungen auf die Standardwerte von 24 Stunden für Patch-Upgrades und 30 Tage für untergeordnete Upgrades zurücksetzen möchten, können Sie die folgenden Flags verwenden:
- Geringfügige Upgrades:
--clear-maintenance-minor-version-disruption-interval - Patch-Upgrades:
--clear-maintenance-patch-version-disruption-interval
Verwenden Sie diese Flags, wenn Sie einen Cluster mit dem Befehl gcloud container cluster
update aktualisieren.
Sie können die Flags gleichzeitig oder unabhängig voneinander verwenden.