Cluster-Upgrade durchführen

In diesem Dokument wird beschrieben, wie Sie Cluster in Google Distributed Cloud (nur Software) für VMware aktualisieren. In diesem Dokument finden Sie eine Anleitung zum Upgrade Ihrer Administrator-Workstation, Ihrer Nutzercluster und Ihrer Administratorcluster. In der Anleitung zum Aktualisieren eines Nutzerclusters wird beschrieben, wie Sie die Steuerungsebene und alle Knotenpools aktualisieren. Wenn Sie die Steuerungsebene und die Knotenpools des Nutzerclusters separat aktualisieren möchten, lesen Sie den Abschnitt Knotenpools aktualisieren.

Diese Seite richtet sich an IT-Administratoren und ‑Betreiber, die den Lebenszyklus der zugrunde liegenden technischen Infrastruktur verwalten. Weitere Informationen zu gängigen Rollen und Beispielaufgaben, auf die wir in Google Cloud -Inhalten verweisen, finden Sie unter Häufig verwendete GKE-Nutzerrollen und -Aufgaben.

Bevor Sie fortfahren, empfehlen wir Ihnen, sich die folgende Dokumentation anzusehen:

  • Übersicht über das Upgrade
    In diesem Dokument werden unter anderem die unterstützte Versionsabweichung und die Versionsregeln für Upgrades beschrieben, die sich für Version 1.28 und höher geändert haben.

  • Best Practices für Upgrades
    Dieses Dokument enthält Checklisten und Best Practices für das Upgraden von Clustern.

Unterschiede bei erweiterten Clustern

Wenn erweiterte Cluster aktiviert sind, gibt es einige Unterschiede bei Upgrades, insbesondere in der Vorschau erweiterter Cluster in Version 1.31. Wenn Sie die Unterschiede beim Upgrade sehen möchten, suchen Sie in diesem Dokument nach dem Wort advanced. Eine Tabelle mit allen Unterschieden finden Sie unter Unterschiede beim Ausführen von Advanced-Clustern.

Automatisches Upgrade auf erweiterte Cluster in Version 1.33

  • gkectl-Version prüfen: Die gkectl-Version muss mit Ihrer Zielversion übereinstimmen. Wenn Sie beispielsweise ein Upgrade eines nicht erweiterten Clusters der Version 1.32 auf einen erweiterten Cluster der Version 1.33.0-gke.799 durchführen, muss die gkectl-Version 1.33.0-gke.799 sein. Diese strenge Versionsanforderung gilt nur während der Umstellung auf einen erweiterten Cluster. Für alle nachfolgenden Upgrades Ihres erweiterten Clusters gelten die Standardregeln für die Versionsabweichung.
  • Versionsabweichung nicht zulässig: Wenn Sie ein Upgrade von einem nicht erweiterten auf einen erweiterten Cluster durchführen, können Sie die Steuerungsebene und die Knotenpools nicht separat aktualisieren. Sie müssen die Steuerungsebene und alle Knotenpools gleichzeitig auf Version 1.33 aktualisieren.

Voraussetzungen

In diesem Abschnitt finden Sie Informationen zu versionsbezogenen Anforderungen und Anforderungen für die Verwendung der GKE On-Prem API-Clients ( Google Cloud -Konsole, Google Cloud CLI und Terraform) für Upgrades.

Versionsregeln

Die Regeln für Upgrades hängen von der Nebenversion des Clusters ab.

  • Bei Versionen 1.30 und niedriger muss die Nebenversion des Nutzerclusters mindestens der Nebenversion des Administratorclusters entsprechen. Die Patchversion spielt keine Rolle. Wenn ein Nutzercluster beispielsweise Version 1.30.1 hat, kann der Administratorcluster auf eine höhere Patchversion wie 1.30.3 aktualisiert werden.

  • Bei Version 1.31 und höher muss die Version des Administratorclusters, einschließlich der Patchversion, mindestens der Version des Nutzerclusters entsprechen. Wenn ein Administratorcluster beispielsweise Version 1.31.1 hat, kann der Nutzercluster höchstens auf Version 1.31.1 aktualisiert werden.

Wenn Sie Ihre Cluster auf Version 1.31 aktualisieren möchten, müssen Sie zuerst alle Ihre Cluster auf Version 1.30 aktualisieren. Wenn alle Cluster die Version 1.30 haben, führen Sie ein Upgrade des Administratorclusters auf Version 1.31 durch. Danach können Sie die Nutzercluster auf dieselbe 1.31-Patchversion wie den Administratorcluster aktualisieren.

Versionsregeln für gkectl

Die Version von gkectl, die Sie für das Upgrade verwenden können, hängt von der Zielclusterversion ab (d. h. der Version des Clusters, auf den Sie ein Upgrade durchführen). In der Regel verwenden Sie dieselbe Version von gkectl wie die Zielversion des Clusters. Während des Upgrades werden die folgenden Regeln erzwungen:

  • Die gkectl-Version darf keine niedrigere Nebenversion als die Nebenversion des Zielclusters sein. Wenn Sie beispielsweise ein Upgrade eines Clusters der Version 1.29 auf Version 1.30 durchführen, können Sie gkectl 1.29 nicht verwenden, da diese niedriger als die Zielclusterversion ist. Patchversionen spielen keine Rolle. Sie können beispielsweise die gkectl-Version 1.29.0-gke.1456 verwenden, um ein Upgrade auf eine höhere Patch-Version wie 1.29.1000-gke.94 durchzuführen.

  • Die Version gkectl darf nicht mehr als zwei Nebenversionen höher sein als die aktuelle Clusterversion. Wenn Sie beispielsweise ein Upgrade eines Clusters der Version 1.28 auf Version 1.29 ausführen, kann die gkectl-Version 1.29 oder 1.30 sein. Sie können jedoch nicht die gkectl-Version 1.31 verwenden, da sie drei Nebenversionen höher ist als die Clusterversion.

  • Wenn Sie ein Upgrade des Clusters auf einen erweiterten Cluster durchführen, muss die gkectl-Version mit der Zielversion übereinstimmen. Wenn Sie beispielsweise ein Upgrade eines nicht erweiterten Clusters der Version 1.32 auf einen erweiterten Cluster der Version 1.33.0-gke.799 durchführen, muss die gkectl-Version 1.33.0-gke.799 sein.

    • Ihr Cluster wird in Version 1.33 standardmäßig auf einen erweiterten Cluster aktualisiert. Das bedeutet, dass bei Upgrades von 1.32 auf 1.33 die gkectl-Version mit der aktualisierten Version übereinstimmen muss.

    • Diese strenge Versionsanforderung gilt nur während der Umstellung auf einen erweiterten Cluster. Für alle nachfolgenden Upgrades Ihres erweiterten Clusters gelten die Standardregeln für die Versionsabweichung.

Falls erforderlich, lesen Sie den Abschnitt gkectl herunterladen, um eine unterstützte Version von gkectl zu erhalten.

Firewallregeln prüfen

In Version 1.29 und später sind serverseitige Preflight-Prüfungen standardmäßig aktiviert. Für serverseitige Preflight-Prüfungen sind zusätzliche Firewallregeln erforderlich. Suchen Sie in den Firewallregeln für Administratorcluster nach „Preflight-Prüfungen“ und achten Sie darauf, dass alle erforderlichen Firewallregeln konfiguriert sind.

Bei serverseitigen Preflight-Prüfungen werden die Preflight-Prüfungen bei der Erstellung eines Nutzerclusters mit gkectl auf dem Administratorcluster und nicht lokal auf der Administrator-Workstation ausgeführt. Serverseitige Preflight-Prüfungen werden auch auf dem Administratorcluster ausgeführt, wenn Sie einen Cluster mit der Google Cloud Console, der Google Cloud CLI oder Terraform aktualisieren.

Wenn Sie einen Administratorcluster aktualisieren, wird in Google Distributed Cloud ein Kubernetes in Docker-Cluster (Art) bereitgestellt, der vorübergehend die Kubernetes-Controller hostet, die zum Aktualisieren des Administratorclusters erforderlich sind. Dieser vorübergehende Cluster wird als Bootstrap-Cluster bezeichnet. Serverseitige Preflight-Prüfungen werden auf dem Bootstrap-Cluster ausgeführt, wenn Sie ein Upgrade eines Administratorclusters durchführen.

stackdriver aktivieren

Wenn Sie den Nutzercluster mit gkectl erstellt haben, müssen Sie vor dem Upgrade darauf achten, dass der Abschnitt stackdriver in der Konfigurationsdatei des Nutzerclusters ausgefüllt ist. Dadurch wird stackdriver aktiviert, was für Logging und Monitoring erforderlich ist. Wenn stackdriver nicht aktiviert ist, füllen Sie den Abschnitt stackdriver in der Konfigurationsdatei des Nutzerclusters aus und aktualisieren Sie den Cluster, bevor Sie das Upgrade durchführen.

Wenn Sie den Cluster mit Terraform, der Google Cloud -Konsole oder der gcloud CLI erstellt haben, ist stackdriver automatisch aktiviert.

Dataplane V2 aktivieren

Ab Version 1.31 muss Dataplane V2 für alle Nutzercluster aktiviert sein. Führen Sie vor dem Upgrade eines Nutzerclusters auf Version 1.31 die folgenden Schritte aus. Wenn Sie Bedenken bezüglich der vorübergehenden Entfernung der NetworkPolicy-Spezifikation haben, wenden Sie sich an den Google-Support.

Legen Sie in der Konfigurationsdatei für den Nutzercluster enableDataplaneV2 auf true fest.

Wenn Ihr Cluster einen NetworkPolicy verwendet, entfernen Sie die Spezifikation vorübergehend aus dem Cluster:

  1. Prüfen Sie, ob auf Ihren Cluster ein NetworkPolicy angewendet wurde, das nicht zum System gehört:

    kubectl --kubeconfig USER_CLUSTER_KUBECONFIG get networkpolicy -A -o wide | grep -v kube-system
    
  2. Wenn die Ausgabe des vorherigen Schritts nicht leer war, speichern Sie jede NetworkPolicy-Spezifikation in einer Datei, damit Sie die Spezifikation nach dem Upgrade des Clusters wieder anwenden können.

    kubectl --kubeconfig USER_CLUSTER_KUBECONFIG get networkpolicy NETWORK_POLICY_NAME -n NETWORK_POLICY_NAMESPACE -o yaml > NETWORK_POLICY_NAME.yaml
    

    Ersetzen Sie Folgendes:

    • NETWORK_POLICY_NAME: Der Name des NetworkPolicy, den Sie speichern.
    • NETWORK_POLICY_NAMESPACE ist der Namespace des NetworkPolicy.
  3. Löschen Sie NetworkPolicy mit dem folgenden Befehl:

    kubectl --kubeconfig USER_CLUSTER_KUBECONFIG delete networkpolicy NETWORK_POLICY_NAME -n NETWORK_POLICY_NAMESPACE
    
  4. Fahren Sie mit dem Upgrade fort.

  5. Wenn Sie nach dem Upgrade nicht systembezogene NetworkPolicy-Spezifikationen entfernt haben, wenden Sie sie mit diesem Befehl wieder an:

    kubectl --kubeconfig USER_CLUSTER_KUBECONFIG apply -f NETWORK_POLICY_NAME.yaml
    

Google API- und IAM-Anforderungen

Wenn Sie ein Cluster auf Version 1.28 und höher aktualisieren möchten, müssen Sie kubernetesmetadata.googleapis.com aktivieren und dem Logging-Monitoring-Dienstkonto die IAM-Rolle kubernetesmetadata.publisher zuweisen. Diese Änderungen sind erforderlich, um Cloud Monitoring zu verwenden.

  1. kubernetesmetadata.googleapis.com aktivieren:

    gcloud services enable --project PROJECT_ID  \
        kubernetesmetadata.googleapis.com
    

    Ersetzen Sie PROJECT_ID durch die ID des Flotten-Hostprojekts, zu dem der Nutzercluster gehört. Dies ist das Projekt, das Sie beim Erstellen des Clusters angegeben haben. Wenn Sie den Cluster mit gkectl erstellt haben, ist dies die Projekt-ID im Feld gkeConnect.projectID in der Cluster-Konfigurationsdatei.

  2. Wenn Ihre Organisation eine Zulassungsliste eingerichtet hat, mit der Traffic von Google APIs und anderen Adressen über Ihren Proxyserver geleitet werden kann, fügen Sie der Zulassungsliste kubernetesmetadata.googleapis.com hinzu.

  3. Weisen Sie dem Dienstkonto für das Logging-Monitoring die Rolle kubernetesmetadata.publisher zu:

    gcloud projects add-iam-policy-binding PROJECT_ID \
        --member "serviceAccount:SERVICE_ACCOUNT_EMAIL" \
        --role "roles/kubernetesmetadata.publisher"
    

    Ersetzen Sie SERVICE_ACCOUNT_EMAIL durch die E-Mail-Adresse Ihres Logging-Monitoring-Dienstkontos.

Legacy-Funktionen bei Upgrades gesperrt

Die folgenden Legacy-Funktionen sind während des Cluster-Upgrades auf Version 1.32 blockiert:

  • Dataplane V1 (Calico)
  • Konfiguration des integrierten F5 Big-IP-Load-Balancers
  • Nicht-HA-Administratorcluster
  • Kubeception-Nutzercluster
  • Seesaw-Load-Balancer

Sie müssen Ihre Cluster zu empfohlenen Funktionen migrieren, bevor Sie ein Upgrade auf Version 1.32 durchführen.

IAM-Anforderungen für das Upgrade von Nutzerclustern

Überspringen Sie diesen Abschnitt, wenn Sie gkectl für das Upgrade des Nutzerclusters verwenden möchten.

Wenn Sie die Google Cloud Console, die Google Cloud CLI oder Terraform verwenden möchten, um ein Upgrade für einen Nutzercluster durchzuführen, und Sie kein Projektinhaber sind, muss Ihnen Identity and Access Management-Rolle roles/gkeonprem.admin für das Google Cloud Projekt zugewiesen werden, in dem der Cluster erstellt wurde. Weitere Informationen zu den in dieser Rolle enthaltenen Berechtigungen finden Sie in der IAM-Dokumentation unter GKE On-Prem-Rollen.

Wenn Sie den Cluster mit der Console aktualisieren möchten, benötigen Sie mindestens:

  • roles/container.viewer. Mit dieser Rolle können Nutzer die GKE-Clusterseite und andere Containerressourcen in der Console aufrufen. Ausführliche Informationen zu den in dieser Rolle enthaltenen Berechtigungen und zum Zuweisen einer Rolle mit Lese-/Schreibberechtigungen finden Sie in der IAM-Dokumentation unter Kubernetes Engine-Rollen.

  • roles/gkehub.viewer. Mit dieser Rolle können Nutzer Cluster in der Console aufrufen. Ausführliche Informationen zu den in dieser Rolle enthaltenen Berechtigungen und zum Zuweisen einer Rolle mit Lese-/Schreibberechtigungen finden Sie in der IAM-Dokumentation unter GKE-Hub-Rollen.

Einschränkungen bei erweiterten Clustern

Beachten Sie die folgenden Einschränkungen, wenn Sie erweiterte Cluster aktiviert haben:

  • Sie müssen gkectl verwenden, um Cluster zu aktualisieren. Die GKE On-Prem API-Clients (die Console, die gcloud CLI und Terraform) werden nicht unterstützt.

  • Es werden nur synchrone Upgrades unterstützt.

Konfigurationsänderungen vor oder nach einem Upgrade vornehmen

Wenn Sie Konfigurationsänderungen an Ihren Clustern vornehmen müssen, führen Sie die Clusteraktualisierung entweder vor oder nach dem Upgrade durch. Die einzige Änderung an der Clusterkonfiguration für ein Upgrade sollte die Version sein. Je nach Clusterversion und -typ werden andere Konfigurationsänderungen entweder stillschweigend ignoriert oder führen dazu, dass das Upgrade fehlschlägt. Weitere Informationen finden Sie unter Nicht unterstützte Änderungen entfernen, um Upgrade zu ermöglichen.

Verfügbare Versionen für Clusterupgrades prüfen

Führen Sie den folgenden Befehl aus, um zu sehen, welche Versionen für ein Upgrade verfügbar sind:

gkectl version --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Ersetzen Sie ADMIN_CLUSTER_KUBECONFIG durch den Pfad zur kubeconfig-Datei des Administratorclusters.

In der Ausgabe werden die aktuelle Version und die für ein Upgrade verfügbaren Versionen angezeigt.

Wenn Sie die Console, die gcloud CLI oder Terraform für das Upgrade verwenden möchten, dauert es nach einer Release etwa 7 bis 14 Tage, bis die Version in der GKE On-Prem API in allen Google Cloud -Regionen verfügbar ist. In der Console werden nur die verfügbaren Versionen für das Upgrade des Nutzerclusters aufgeführt. Die Schritte zum Aktualisieren eines Nutzerclusters mit der gcloud CLI oder Terraform umfassen einen Schritt zum Ausführen von gcloud container vmware clusters query-version-config, um verfügbare Versionen für das Upgrade abzurufen.

Führen Sie ein Upgrade Ihrer Administrator-Workstation durch.

Die Art und Weise, wie Sie Ihre Administrator-Workstation aktualisieren, hängt davon ab, wie Sie sie erstellt haben: mit gkeadm oder nutzerverwaltet.

gkeadm

Erforderliche Dateien suchen

Vor dem Erstellen Ihrer Administrator-Workstation haben Sie eine Konfigurationsdatei für die Administrator-Workstation ausgefüllt, die von gkeadm create config generiert wurde. Der Standardname für diese Datei ist admin-ws-config.yaml.

Darüber hinaus hat Ihre Workstation eine Informationsdatei. Der Standardname dieser Datei entspricht dem Namen Ihrer Administrator-Workstation.

Suchen Sie die Konfigurationsdatei für die Administrator-Workstation und die Informationsdatei. Sie benötigen sie für die Durchführung der Upgradeschritte. Wenn sich diese Dateien in Ihrem aktuellen Verzeichnis befinden und die Standardnamen haben, müssen Sie sie beim Ausführen der Upgrade-Befehle nicht angeben. Wenn sich diese Dateien in einem anderen Verzeichnis befinden oder Sie die Dateinamen geändert haben, geben Sie sie mit den Flags --config und --info-file an.

Wenn Ihre Ausgabe-Informationsdatei fehlt, können Sie sie neu erstellen. Weitere Informationen finden Sie unter Neuerstellung einer Informationsdatei, falls sie fehlt.

Upgrade

So führen Sie ein Upgrade der Administratorworkstation durch:

  1. Prüfen Sie das Feld adminWorkstation.diskGB in der Konfigurationsdatei für die Administrator-Workstation und achten Sie darauf, dass die angegebene Größe mindestens 100 beträgt, z. B.:

    adminWorkstation:
      diskGB: 100
    

    Beim Upgrade auf Version 1.28 und höher sind 100 GB erforderlich. Das Cluster-Upgrade schlägt fehl, wenn die Administrator-Workstation nicht genügend Speicherplatz hat.

  2. Laden Sie gkeadm von Ihrem Jump-Server herunter:

    gkeadm upgrade gkeadm --target-version TARGET_VERSION
    

    Ersetzen Sie TARGET_VERSION durch die Version, auf die Sie das Upgrade ausführen. Sie müssen eine vollständige Versionsnummer im Format X.Y.Z-gke.N. angeben. Eine Liste der Google Distributed Cloud-Versionen finden Sie unter Versionsverwaltung.

  3. Führen Sie ein Upgrade Ihrer Administrator-Workstation durch.

    gkeadm upgrade admin-workstation --config AW_CONFIG_FILE \
        --info-file INFO_FILE
    

    Ersetzen Sie Folgendes:

    • AW_CONFIG_FILE ist der Pfad zur Konfigurationsdatei der Administrator-Workstation. Sie können dieses Flag auslassen, wenn sich die Datei im aktuellen Verzeichnis befindet und den Namen admin-ws-config.yaml hat.

    • INFO_FILE ist der Pfad zur Informationsdatei. Sie können dieses Flag auslassen, wenn sich die Datei im aktuellen Verzeichnis befindet. Der Standardname dieser Datei entspricht dem Namen Ihrer Administrator-Workstation.

Vom Nutzer verwaltet

Rufen Sie auf Ihrer Administrator-Workstation ein Verzeichnis auf, in dem Sie eine neue Version von gkectl installieren möchten.

  1. gkectl herunterladen:

    gcloud storage cp gs://gke-on-prem-release/gkectl/TARGET_VERSION/gkectl ./
    chmod +x gkectl
    

    Ersetzen Sie TARGET_VERSION durch die Version, auf die Sie das Upgrade ausführen. Sie müssen eine vollständige Versionsnummer im Format X.Y.Z-gke.N. angeben. Eine Liste der Google Distributed Cloud-Versionen finden Sie unter Versionsverwaltung.

  2. Laden Sie das Google Distributed Cloud-Bundle herunter. Die Version muss mit der Version übereinstimmen, die Sie zum Herunterladen von gkectl verwendet haben:

    gcloud storage cp gs://gke-on-prem-release/gke-onprem-bundle/TARGET_VERSION/gke-onprem-vsphere-TARGET_VERSION.tgz ./
    

Administratorcluster aktualisieren

Die Schritte zum Upgraden des Administratorclusters variieren je nach der Nebenversion, auf die Sie ein Upgrade durchführen (der Zielversion):

1.31 und höher

Wenn die Zielversion 1.31 oder höher ist, müssen Sie Ihren Administratorcluster aktualisieren, bevor Sie Ihre Nutzercluster auf die nächste Nebenversion aktualisieren. In Version 1.31 und höher muss die Version des Administratorclusters, einschließlich der Patchversion, mindestens der Version des Nutzerclusters entsprechen. Wenn ein Administratorcluster beispielsweise Version 1.31.1 hat, kann der Nutzercluster höchstens auf Version 1.31.1 aktualisiert werden.

Führen Sie den folgenden Befehl auf Ihrer Administrator-Workstation aus, um Betriebssystem-Images in vSphere zu importieren:

gkectl prepare \
    --bundle-path /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz \
    --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Ersetzen Sie ADMIN_CLUSTER_KUBECONFIG durch den Pfad zur kubeconfig-Datei des Administratorclusters.

1.30 und niedriger

Wenn die Zielversion 1.30 oder niedriger ist, müssen Sie alle Nutzercluster aktualisieren, bevor Sie den Administratorcluster aktualisieren. Die Nebenversion des Administratorclusters muss kleiner oder gleich der Nebenversion des Nutzerclusters sein. Die Patch-Version spielt keine Rolle. Wenn ein Nutzercluster beispielsweise die Version 1.30.1 hat, kann der Administratorcluster auf eine höhere Patchversion wie 1.30.3 aktualisiert werden.

Hinweise:

  1. Wenn Sie auf Version 1.13 oder höher aktualisieren, müssen Sie zuerst den Administratorcluster registrieren. Füllen Sie dazu den Abschnitt gkeConnect in der Konfigurationsdatei des Administratorclusters aus. Führen Sie den Befehl gkectl update cluster mit den Änderungen der Konfigurationsdatei aus.

  2. Achten Sie darauf, dass gkectl und Ihre Cluster in der richtigen Version für ein Upgrade gespeichert sind und dass Sie das entsprechende Bundle heruntergeladen haben. Die Versionsabweichung zwischen Ihren Administrator- und Nutzerclustern hängt von der Google Distributed Cloud-Version ab. Informationen dazu, wie Sie Ihren Administratorcluster aktualisieren können, finden Sie unter Abweichung der Versionen von Administrator- und Nutzerclustern.

  3. Achten Sie darauf, dass das Feld bundlepath in der Konfigurationsdatei für den Administratorcluster mit dem Pfad des Bundles übereinstimmt, auf das Sie aktualisieren möchten.

    Wenn Sie weitere Änderungen an den Feldern in der Konfigurationsdatei des Administratorclusters vornehmen, werden diese Änderungen während des Upgrades ignoriert. Damit diese Änderungen wirksam werden, müssen Sie zuerst den Cluster aktualisieren und dann einen Aktualisierungsbefehl mit den Änderungen der Konfigurationsdatei ausführen, um andere Änderungen am Cluster vorzunehmen.

Führen Sie das Upgrade aus

Führen Sie die Schritte in diesem Abschnitt auf Ihrer neuen Administrator-Workstation aus. Es gibt zwei Varianten des Befehls gkectl upgrade admin:

  • Asynchron:
    Bei der asynchronen Variante wird mit dem Befehl das Upgrade gestartet und dann abgeschlossen. Sie müssen die Ausgabe des Befehls nicht während des gesamten Upgrades im Auge behalten. Stattdessen können Sie den Fortschritt des Upgrades regelmäßig mit den Befehlen gkectl list admin und gkectl describe admin prüfen. Wenn Sie die asynchrone Variante verwenden möchten, fügen Sie dem Befehl das Flag --async hinzu.

    Anforderungen für ein asynchrones Upgrade:

    • Wird nur für HA-Administratorcluster mit Version 1.29 oder höher unterstützt.
    • Für alle Nutzercluster muss Controlplane V2 aktiviert sein.
    • Version 1.31: Wird in erweiterten Clustern nicht unterstützt.
    • Version 1.32 und höher: Verfügbar in erweiterten Clustern.
  • Synchron:
    Bei der synchronen Variante gibt der Befehl gkectl upgrade admin während des Upgrades Statusmeldungen auf der Administrator-Workstation aus.

Asynchrones Upgrade

  1. Starten Sie auf Ihrer Administrator-Workstation ein asynchrones Upgrade:

    gkectl upgrade admin \
      --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
      --config ADMIN_CLUSTER_CONFIG_FILE \
      --async
    

    Ersetzen Sie Folgendes:

    • ADMIN_CLUSTER_KUBECONFIG: der Pfad zur kubeconfig-Datei des Administratorclusters.

    • ADMIN_CLUSTER_CONFIG_FILE: der Pfad zur Konfigurationsdatei des Administratorclusters.

    Der vorherige Befehl wird ausgeführt und Sie können Ihre Administrator-Workstation während des Upgrades weiter verwenden.

  2. So sehen Sie den Status des Upgrades:

    gkectl list admin --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Die Ausgabe zeigt einen Wert für den Cluster STATE. Wenn das Upgrade des Clusters noch läuft, ist der Wert von STATE UPGRADING. Beispiel:

    NAME              STATE         AGE    VERSION
    gke-admin-test    UPGRADING     9h     1.33.100-gke.89
    

    Die möglichen Werte für STATE sind RUNNING, UPGRADING, RECONCILING, ERROR und UNKNOWN.

  3. So rufen Sie weitere Informationen zum Upgradefortschritt und zu Clusterereignissen ab:

    gkectl describe admin --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Die Ausgabe zeigt die benutzerdefinierte OnPremAdminCluster-Ressource für den angegebenen Administratorcluster, einschließlich Clusterstatus, Bedingungen und Ereignissen.

    Wir erfassen Ereignisse für den Beginn und das Ende jeder kritischen Upgrade-Phase.

    Beispielausgabe:

    Events:
    Type    Reason                             Age   From                             Message
    ----       ------                                  ----     ----                                -------
    Normal  ControlPlaneUpgradeStarted         40m   onprem-admin-cluster-controller  Creating or updating admin cluster API Controller
    Normal  ControlPlaneMachineUpgradeStarted  40m   onprem-admin-cluster-controller  Creating or updating control plane machine
    Normal  StatusChanged                      40m   onprem-admin-cluster-controller  OnPremAdminCluster status changed:
    - New ClusterState condition: UPGRADING
    - New Ready condition: False, CreateOrUpdateControlPlaneMachine, Creating or updating control plane machine
    Normal   StatusChanged      2m                onprem-admin-cluster-controller  OnPremAdminCluster status changed:
    - New ClusterState condition: RUNNING
    - New Ready condition: True, ClusterRunning, Cluster is running
    
  4. Wenn das Upgrade abgeschlossen ist, wird in gkectl list admin ein STATUS von RUNNING angezeigt:

    NAME              STATE         AGE    VERSION
    gke-admin-test    RUNNING       9h     1.33.100-gke.89
    

    Wenn das Upgrade abgeschlossen ist, wird in gkectl describe admin außerdem das Feld Last GKE On Prem Version unter Status angezeigt. Beispiel:

    Status:
      Cluster State:  RUNNING
      Last GKE On Prem Version:  1.33.0-gke.1
    

Fehlerbehebung beim asynchronen Upgrade

Bei einem asynchronen Upgrade hängt die Zeitlimitdauer von der Anzahl der Knoten im Cluster ab. Wenn das Upgrade länger als die Zeitüberschreitung dauert, wird der Clusterstatus von UPGRADING in ERROR geändert. Es wird ein Ereignis ausgegeben, in dem steht, dass der Upgradevorgang abgelaufen ist. Der Status ERROR bedeutet, dass das Upgrade länger als erwartet dauert, aber nicht beendet wurde. Der Controller setzt die Abstimmung fort und wiederholt den Vorgang immer wieder. Wenn ein Upgrade blockiert wird oder fehlschlägt, können Sie gkectl diagnose ausführen, um nach häufigen Clusterproblemen zu suchen. Anhand des Ergebnisses können Sie entscheiden, ob Sie Fehler manuell beheben oder sich an den Google Cloud -Support wenden möchten, um weitere Unterstützung zu erhalten.

Synchrones Upgrade

  1. Führen Sie dazu diesen Befehl aus:

    gkectl upgrade admin \
      --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
      --config ADMIN_CLUSTER_CONFIG_FILE
    

    Ersetzen Sie Folgendes:

    • ADMIN_CLUSTER_KUBECONFIG: Der Pfad zur kubeconfig-Datei des Administratorclusters.

    • ADMIN_CLUSTER_CONFIG_FILE: der Pfad zur Konfigurationsdatei des Administratorclusters.

    Mit dem Befehl gkectl upgrade werden Preflight-Prüfungen ausgeführt. Wenn die Preflight-Prüfungen fehlschlagen, wird der Befehl blockiert. Korrigieren Sie die Fehler oder verwenden Sie das Flag --skip-preflight-check-blocking mit dem Befehl, um die Blockierung aufzuheben.

  2. Wenn Sie auf Version 1.14.0 oder höher aktualisieren, wird eine neue kubeconfig-Datei für den Administratorcluster generiert, die alle vorhandenen Dateien überschreibt. Führen Sie den folgenden Befehl aus, um Clusterdetails in der Datei aufzurufen:

    kubectl config view --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Nutzercluster aktualisieren

Sie können gkectl, die Console, die gcloud CLI oder Terraform verwenden, um einen Nutzercluster zu aktualisieren. Informationen zur Auswahl des Tools finden Sie unter Tool zum Upgrade von Nutzerclustern auswählen.

gkectl

Upgrade eines Nutzerclusters vorbereiten

Führen Sie die folgenden Schritte auf Ihrer Administrator-Workstation aus:

  1. Führen Sie diesen Schritt nur aus, wenn die TARGET_VERSION-Version 1.30 oder niedriger ist oder wenn Sie den Nutzercluster auf eine andere Version als den Administratorcluster aktualisieren. Führen Sie gkectl prepare aus, um Betriebssystem-Images in vSphere zu importieren:

    gkectl prepare \
      --bundle-path /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz \
      --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    
  2. Wenn Ihr Cluster einen Windows-Knotenpool hat, führen Sie gkectl prepare windows aus und aktualisieren Sie das Feld osImage für den Knotenpool. Eine detaillierte Anleitung finden Sie unter Nutzercluster mit Windows-Knotenpools aktualisieren.

  3. Legen Sie in der Konfigurationsdatei des Nutzerclusters gkeOnPremVersion auf die Zielversion des Upgrades fest.

Preflight-Prüfungen ausführen

Wenn Sie ein Upgrade auf Version 1.29 oder höher durchführen, können Sie die Preflight-Prüfungen vor dem Upgrade eines Nutzerclusters ausführen:

gkectl upgrade cluster \
    --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
    --config USER_CLUSTER_CONFIG \
    --dry-run

Ersetzen Sie USER_CLUSTER_CONFIG durch den Pfad zur Konfigurationsdatei des Nutzerclusters.

Mit dem Flag --dry-run führt gkectl upgrade cluster die Preflight-Prüfungen aus, startet aber nicht den Upgradeprozess. In früheren Versionen von Google Distributed Cloud werden zwar Preflight-Prüfungen ausgeführt, diese können jedoch nicht unabhängig vom Upgrade ausgeführt werden. Wenn Sie das Flag --dry-run hinzufügen, können Sie alle Probleme ermitteln und beheben, die bei den Preflight-Prüfungen mit Ihrem Nutzercluster vor dem Upgrade festgestellt werden.

Führen Sie gkectl upgrade cluster aus

Es gibt zwei Varianten des Befehls gkectl upgrade cluster:

  • Asynchron (empfohlen):
    Bei der asynchronen Variante wird das Upgrade mit dem Befehl gestartet und dann abgeschlossen. Sie müssen die Ausgabe des Befehls nicht während des gesamten Upgrades im Auge behalten. Stattdessen können Sie den Fortschritt des Upgrades regelmäßig mit den Befehlen gkectl list clusters und gkectl describe clusters prüfen. Wenn Sie die asynchrone Variante verwenden möchten, fügen Sie dem Befehl das Flag --async hinzu.

    • Version 1.31: Nicht für erweiterte Cluster verfügbar.
    • Version 1.32 und höher: Verfügbar in erweiterten Clustern.
  • Synchron:
    Bei der synchronen Variante gibt der Befehl gkectl upgrade cluster während des Upgrades Statusmeldungen auf der Administrator-Workstation aus.

Asynchrones Upgrade

  1. Überspringen Sie diesen Schritt, wenn Sie auf eine Version aktualisieren, die höher als 1.16 ist.

    Wenn Sie vorbereitete Anmeldedaten und eine private Registry für den Nutzercluster verwenden, muss die Anmeldedaten der privaten Registry vor dem Upgrade des Nutzerclusters vorbereitet werden. Informationen zum Vorbereiten der Anmeldedaten der privaten Registry finden Sie unter Vorbereitete Anmeldedaten für Nutzercluster konfigurieren.

  2. Starten Sie auf Ihrer Administrator-Workstation ein asynchrones Upgrade:

    gkectl upgrade cluster \
      --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
      --config USER_CLUSTER_CONFIG \
      --async
    

    Der vorherige Befehl wird ausgeführt und Sie können Ihre Administrator-Workstation während des Upgrades weiter verwenden.

  3. So sehen Sie den Status des Upgrades:

    gkectl list clusters --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Die Ausgabe zeigt einen Wert für den Cluster STATE. Wenn das Upgrade des Clusters noch läuft, ist der Wert von STATE UPGRADING. Beispiel:

    NAMESPACE             NAME    READY   STATE       AGE   VERSION
    my-uc-gkeonprem-mgmt  my-uc   False   UPGRADING   9h    1.33.0-gke.1
    

    Die möglichen Werte für STATE sind PROVISIONING, UPGRADING, DELETING, UPDATING, RUNNING, RECONCILING, ERROR und UNKNOWN.

  4. So rufen Sie weitere Informationen zum Upgradefortschritt und zu Clusterereignissen ab:

    gkectl describe clusters --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
      --cluster USER_CLUSTER_NAME -v 5
    

    Die Ausgabe zeigt die benutzerdefinierte OnPremUserCluster-Ressource für den angegebenen Nutzercluster, einschließlich Clusterstatus, Bedingungen und Ereignissen.

    Wir erfassen Ereignisse für den Beginn und das Ende jeder wichtigen Upgradephase, darunter:

    • ControlPlaneUpgrade
    • MasterNodeUpgrade
    • AddonsUpgrade
    • NodePoolsUpgrade

    Beispielausgabe:

    Events:
    Type    Reason                      Age    From                            Message
    ----     ------                     ----   ----                            -------
    Normal  NodePoolsUpgradeStarted     22m    onprem-user-cluster-controller  Creating or updating node pools: pool-2: Creating or updating node pool
    Normal  AddonsUpgradeStarted        22m    onprem-user-cluster-controller  Creating or updating addon workloads
    Normal  ControlPlaneUpgradeStarted  25m    onprem-user-cluster-controller  Creating or updating cluster control plane workloads: deploying user-kube-apiserver-base, ...: 14/15 pods are ready
    Normal  ControlPlaneUpgradeFinished 23m    onprem-user-cluster-controller  Control plane is running
    
  5. Wenn das Upgrade abgeschlossen ist, wird in gkectl list clusters ein STATUS von RUNNING angezeigt:

    NAMESPACE             NAME    READY   STATE     AGE     VERSION
    my-uc-gkeonprem-mgmt  my-uc   True    RUNNING   9h      1.33.0-gke.1
    

    Wenn das Upgrade abgeschlossen ist, wird in gkectl describe clusters außerdem das Feld Last GKE On Prem Version unter Status angezeigt. Beispiel:

    Status:
    Cluster State:  RUNNING
    Last GKE On Prem Version:  1.33.0-gke.1
    

Fehlerbehebung beim asynchronen Upgrade

Bei einem asynchronen Upgrade basiert die Zeitüberschreitungsdauer auf der Anzahl der Knoten im Cluster. Wenn das Upgrade länger als die Zeitüberschreitung dauert, wird der Clusterstatus von UPGRADING in ERROR geändert. Es wird ein Ereignis ausgegeben, in dem steht, dass der Upgradevorgang abgelaufen ist. Der Status ERROR bedeutet, dass das Upgrade länger als erwartet dauert, aber nicht beendet wurde. Der Controller setzt den Abgleich fort und wiederholt den Vorgang.

In der Regel ist ein Zeitüberschreitungsfehler auf einen Deadlock zurückzuführen, der durch ein PodDisruptionBudget (PDB) verursacht wird. In diesem Fall können Pods nicht von alten Knoten entfernt und die alten Knoten nicht geleert werden. Wenn das Entfernen des Pods länger als 10 Minuten dauert, wird ein Ereignis in das OnPremUserCluster-Objekt geschrieben. Sie können das Ereignis mit dem Befehl gkectl describe clusters erfassen. Anschließend können Sie das PDB so anpassen, dass der Knoten entladen werden kann. Danach kann das Upgrade fortgesetzt und schließlich abgeschlossen werden.

Beispielereignis:

Warning  PodEvictionTooLong  96s (x2 over 4m7s)  onprem-user-cluster-controller
Waiting too long(>10m0.00000003s) for (kube-system/coredns-856d6dbfdf-dl6nz) eviction.

Wenn ein Upgrade blockiert wird oder fehlschlägt, können Sie außerdem gkectl diagnose ausführen, um nach häufigen Clusterproblemen zu suchen. Anhand des Ergebnisses können Sie entscheiden, ob Sie Fehler manuell beheben oder sich an das Anthos-Supportteam wenden möchten, um weitere Unterstützung zu erhalten.

Synchrones Upgrade

Mit dem Befehl gkectl upgrade werden Preflight-Prüfungen ausgeführt. Wenn die Preflight-Prüfungen fehlschlagen, wird der Befehl blockiert. Sie müssen die Fehler beheben oder das Flag --skip-preflight-check-blocking verwenden. Sie sollten die Preflight-Prüfungen nur überspringen, wenn Sie sicher sind, dass keine Fehler existieren.

Führen Sie die folgenden Schritte auf Ihrer Administrator-Workstation aus:

  1. Überspringen Sie diesen Schritt, wenn Sie auf eine Version aktualisieren, die höher als 1.16 ist.

    Wenn Sie vorbereitete Anmeldedaten und eine private Registry für den Nutzercluster verwenden, muss die Anmeldedaten der privaten Registry vor dem Upgrade des Nutzerclusters vorbereitet werden. Informationen zum Vorbereiten der Anmeldedaten der privaten Registry finden Sie unter Vorbereitete Anmeldedaten für Nutzercluster konfigurieren.

  2. Aktualisieren Sie den Cluster:

    gkectl upgrade cluster \
      --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
      --config USER_CLUSTER_CONFIG
    
  3. Wenn Sie auf Version 1.14.0 oder höher aktualisieren, wird eine neue kubeconfig-Datei für den Nutzercluster generiert, die alle vorhandenen Dateien überschreibt. Führen Sie den folgenden Befehl aus, um Clusterdetails in der Datei aufzurufen:

    kubectl config view --kubeconfig USER_CLUSTER_KUBECONFIG

Upgrade fortsetzen

Wenn das Upgrade eines Nutzerclusters unterbrochen wird, können Sie das Upgrade des Nutzerclusters fortsetzen, indem Sie denselben Upgrade-Befehl mit dem Flag --skip-validation-all ausführen:

gkectl upgrade cluster \
    --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
    --config USER_CLUSTER_CONFIG_FILE \
    --skip-validation-all

Console

Für das Upgrade eines Nutzerclusters sind einige Änderungen am Administratorcluster erforderlich. In der Konsole wird automatisch Folgendes ausgeführt:

  • Registriert den Administratorcluster in der GKE On-Prem API, falls er noch nicht registriert ist.

  • Lädt ein Komponentenpaket auf den Administratorcluster herunter und stellt es dort bereit. Die Version der Komponenten entspricht der Version, die Sie für das Upgrade angeben. Mit diesen Komponenten kann der Administratorcluster Nutzercluster in dieser Version verwalten.

So führen Sie ein Upgrade für einen Nutzercluster durch:

  1. Rufen Sie in der Console die Seite Google Kubernetes Engine-Cluster – Übersicht auf.

    Zu GKE-Clustern

  2. Wählen Sie das Google Cloud Projekt und dann den Cluster aus, den Sie upgraden möchten.

  3. Klicken Sie im Bereich Details auf Weitere Details.

  4. Klicken Sie im Abschnitt Clustergrundlagen auf Upgrade.

  5. Wählen Sie in der Liste Zielversion auswählen die Version aus, auf die Sie aktualisieren möchten. Die kuratierte Liste enthält nur die neuesten Patchreleases.

  6. Klicken Sie auf Upgrade.

Vor dem Upgrade des Clusters werden Preflight-Prüfungen ausgeführt, um den Cluster- und den Knotenstatus zu validieren. Sind die Preflight-Prüfungen erfolgreich, wird der Administratorcluster aktualisiert. Das Upgrade dauert etwa 30 Minuten.

Klicken Sie auf dem Tab Clusterdetails auf Details ansehen, um den Status der Aktualisierung anzuzeigen.

gcloud-CLI

Für das Upgrade eines Nutzerclusters sind einige Änderungen am Administratorcluster erforderlich. Der Befehl gcloud container vmware clusters upgrade führt automatisch die folgenden Schritte aus:

  • Registriert den Administratorcluster in der GKE On-Prem API, falls er noch nicht registriert ist.

  • Lädt ein Komponentenpaket auf den Administratorcluster herunter und stellt es dort bereit. Die Version der Komponenten entspricht der Version, die Sie für das Upgrade angeben. Mit diesen Komponenten kann der Administratorcluster Nutzercluster in dieser Version verwalten.

So führen Sie ein Upgrade für einen Nutzercluster durch:

  1. Aktualisieren Sie die Google Cloud CLI-Komponenten:

    gcloud components update
    
  2. Rufen Sie eine Liste der verfügbaren Versionen auf, auf die ein Upgrade möglich ist:

    gcloud container vmware clusters query-version-config \
      --cluster=USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION
    

    Die Ausgabe dieses Befehls sieht in etwa so aus:

    versions:
    - version: 1.16.3-gke.45
    - version: 1.16.2-gke.28
    - version: 1.16.1-gke.45
    - version: 1.16.0-gke.669
    - version: 1.15.6-gke.25
    - version: 1.15.5-gke.41
    
    An Anthos version must be made available on the admin cluster ahead of the user
    cluster creation or upgrade. Versions annotated with isInstalled=true are
    installed on the admin cluster for the purpose of user cluster creation or
    upgrade whereas other version are released and will be available for upgrade
    once dependencies are resolved.
    
    To install the version in the admin cluster, run:
    $ gcloud container vmware admin-clusters update my-admin-cluster --required-platform-version=VERSION
    

    Sie können die Meldung nach der Liste der Versionen ignorieren. Es spielt keine Rolle, ob die Version, die Sie aktualisieren, auf dem Administratorcluster installiert ist. Mit dem Befehl upgrade wird ein Paket der Komponenten heruntergeladen und bereitgestellt, das der Version entspricht, die Sie im Befehl upgrade angeben.

  3. Aktualisieren Sie den Cluster.

    gcloud container vmware clusters upgrade USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --version=VERSION
    

    Ersetzen Sie VERSION durch die Google Distributed Cloud-Version, auf die Sie ein Upgrade ausführen möchten. Geben Sie eine Version aus der Ausgabe des vorherigen Befehls an. Wir empfehlen, ein Upgrade auf die aktuelle Patch-Version durchzuführen.

    Die Ausgabe des Befehls sieht in etwa so aus:

    Waiting for operation [projects/example-project-12345/locations/us-west1/operations/operation-1679543737105-5f7893fd5bae9-942b3f97-75e59179] to complete.
    

    In der Beispielausgabe ist der String operation-1679543737105-5f7893fd5bae9-942b3f97-75e59179 der OPERATION_ID des Vorgangs mit langer Ausführungszeit. Sie können den Status des Vorgangs ermitteln, indem Sie den folgenden Befehl in einem anderen Terminalfenster ausführen:

    gcloud container vmware operations describe OPERATION_ID \
      --project=PROJECT_ID \
      --location=REGION
    

Terraform

  1. Aktualisieren Sie die Google Cloud CLI-Komponenten:

    gcloud components update
    
  2. Falls noch nicht geschehen, registrieren Sie den Administratorcluster in der GKE On-Prem API. Nachdem der Cluster in der GKE On-Prem API registriert wurde, müssen Sie diesen Schritt nicht noch einmal ausführen.

  3. Rufen Sie eine Liste der verfügbaren Versionen auf, auf die ein Upgrade möglich ist:

    gcloud container vmware clusters query-version-config \
      --cluster=USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION
    

    Ersetzen Sie Folgendes:

    • USER_CLUSTER_NAME: der Name des Nutzerclusters.

    • PROJECT_ID: Die ID des Flottenprojekts, zu dem Nutzercluster gehört. Dies ist das Projekt, das Sie beim Erstellen des Clusters angegeben haben. Wenn Sie den Cluster mit gkectl erstellt haben, ist dies die Projekt-ID im Feld gkeConnect.projectID in der Cluster-Konfigurationsdatei.

    • REGION: Die Google Cloud Region, in der die GKE On-Prem API ausgeführt wird und Metadaten speichert. In der main.tf-Datei, mit der Sie den Nutzercluster erstellt haben, befindet sich die Region im Feld location der Clusterressource.

    Die Ausgabe dieses Befehls sieht in etwa so aus:

    versions:
    - version: 1.16.3-gke.45
    - version: 1.16.2-gke.28
    - version: 1.16.1-gke.45
    - version: 1.16.0-gke.669
    - version: 1.15.6-gke.25
    - version: 1.15.5-gke.41
    
    An Anthos version must be made available on the admin cluster ahead of the user
    cluster creation or upgrade. Versions annotated with isInstalled=true are
    installed on the admin cluster for the purpose of user cluster creation or
    upgrade whereas other version are released and will be available for upgrade
    once dependencies are resolved.
    
    To install the version in the admin cluster, run:
    $ gcloud container vmware admin-clusters update my-admin-cluster --required-platform-version=VERSION
    
  4. Laden Sie die neue Version der Komponenten herunter und stellen Sie sie im Administratorcluster bereit:

    gcloud container vmware admin-clusters update ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --required-platform-version=VERSION
    

    Mit diesem Befehl wird die Version der Komponenten, die Sie in --required-platform-version angeben, auf den Administratorcluster heruntergeladen und anschließend bereitgestellt. Mit diesen Komponenten kann der Administratorcluster Nutzercluster in dieser Version verwalten.

  5. Ändern Sie in der main.tf-Datei, mit der Sie den Nutzercluster erstellt haben, on_prem_version in der Clusterressource auf die neue Version.

  6. Initialisieren und erstellen Sie den Terraform-Plan:

    terraform init
    

    Terraform installiert alle erforderlichen Bibliotheken, z. B. den Google Cloud-Anbieter.

  7. Überprüfen Sie die Konfiguration und nehmen Sie bei Bedarf Änderungen vor:

    terraform plan
    
  8. Wenden Sie den Terraform-Plan an, um den Nutzercluster zu erstellen:

    terraform apply
    

Komplettes Bundle entfernen

Wenn Sie ein vollständiges Bundle heruntergeladen haben und gkectl prepare erfolgreich ausgeführt und der Administratorcluster und alle Nutzercluster aktualisiert wurden, sollten Sie das vollständige Bundle löschen, um Speicherplatz auf der Administrator-Workstation zu sparen. Führen Sie den folgenden Befehl aus, um das gesamte Bundle zu löschen:

rm /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION-full.tgz

Upgrade eines Administratorclusters fortsetzen

Wenn das Upgrade eines Administratorclusters unterbrochen wird oder fehlschlägt, kann das Upgrade fortgesetzt werden, falls der Prüfpunkt des Administratorclusters den Status enthält, der zur Wiederherstellung des Zustands vor der Unterbrechung erforderlich ist.

Warnung: Reparieren Sie den Admin-Master nach einem fehlgeschlagenen Upgradeversuch nicht mit gkectl repair admin-master. Dadurch gerät der Administratorcluster in einen fehlerhaften Zustand.

Gehen Sie so vor:

  1. Prüfen Sie, ob die Administratorsteuerungsebene fehlerfrei ist, bevor Sie mit dem ersten Upgradeversuch beginnen. Siehe Clusterprobleme diagnostizieren. Führen Sie wie in diesem Thema beschrieben den Befehl gkectl diagnose cluster für den Administratorcluster aus.

  2. Wenn die Administratorsteuerungsebene vor dem ersten Upgradefehler fehlerhaft ist, reparieren Sie die Administratorsteuerungsebene mit dem Befehl gkectl repair admin-master.

  3. Wenn Sie den Upgradebefehl noch einmal ausführen, nachdem ein Upgrade unterbrochen wurde oder fehlgeschlagen ist, verwenden Sie dasselbe Bundle und dieselbe Zielversion wie beim vorherigen Upgradeversuch.

Wenn Sie den Upgradebefehl noch einmal ausführen, erstellt das fortgesetzte Upgrade den Status des Administratorclusters vom Prüfpunkt neu und führt das gesamte Upgrade noch einmal durch. Ab Version 1.12.0 wird bei einer fehlerhaften Administratorsteuerungsebene direkt auf die Zielversion aktualisiert, ohne dass versucht wird, den Administratorcluster in der Quellversion wiederherzustellen, bevor das Upgrade durchgeführt wird.

Das Upgrade wird ab dem Punkt fortgesetzt, an dem es fehlgeschlagen ist oder beendet wurde, sofern der Prüfpunkt des Administratorclusters verfügbar ist. Wenn der Prüfpunkt nicht verfügbar ist, greift das Upgrade auf die Administratorsteuerungsebene zurück. Daher muss die Administratorsteuerungsebene fehlerfrei sein, um mit dem Upgrade fortfahren zu können. Nach einem erfolgreichen Upgrade wird der Prüfpunkt neu generiert.

Wenn gkectl während eines Upgrade des Administratorclusters unerwartet beendet wird, wird der Typcluster nicht bereinigt. Bevor Sie den Upgradebefehl noch einmal ausführen, um das Upgrade fortzusetzen, löschen Sie den Typcluster:

docker stop gkectl-control-plane && docker rm gkectl-control-plane

Führen Sie nach dem Löschen des Typclusters den Upgradebefehl noch einmal aus.

Rollback einer Administrator-Workstation nach einem Upgrade

Sie können die Administrator-Workstation auf die Version zurücksetzen, die vor dem Upgrade verwendet wurde.

Während des Upgrades erfasst gkeadm die vor dem Upgrade verwendete Version in der Ausgabeinformationsdatei. Während des Rollbacks verwendet gkeadm die aufgelistete Version, um die ältere Datei herunterzuladen.

So führen Sie ein Rollback Ihrer Administrator-Workstation auf die vorherige Version durch:

gkeadm rollback admin-workstation --config=AW_CONFIG_FILE

Sie können --config=AW_CONFIG_FILE weglassen, wenn die Konfigurationsdatei der Administrator-Workstation der Standard-admin-ws-config.yaml ist. Andernfalls ersetzen Sie AW_CONFIG_FILE durch den Pfad zur Konfigurationsdatei der Administrator-Workstation.

Der Rollback-Befehl führt folgende Schritte aus:

  1. Die Rollback-Version von gkeadm wird heruntergeladen.
  2. Sie sichert das Basisverzeichnis der aktuellen Administrator-Workstation.
  3. Erstellt eine neue Administrator-Workstation mit der Rollback-Version von gkeadm.
  4. Löscht die ursprüngliche Administrator-Workstation.

Bundle mit einer anderen Version für das Upgrade installieren

Wenn Sie ein Upgrade Ihrer Workstation durchführen, wird dort ein Bundle mit einer entsprechenden Version installiert. Wenn Sie eine andere Version verwenden möchten, führen Sie die folgenden Schritte aus, um ein Bundle für TARGET_VERSION zu installieren. Dies ist die Version, auf die Sie ein Upgrade ausführen möchten.

  1. Führen Sie den folgenden Befehl aus, um die aktuelle gkectl und die Clusterversionen zu prüfen. Mit dem Flag --details/-d erhalten Sie genauere Informationen.

    gkectl version --kubeconfig ADMIN_CLUSTER_KUBECONFIG --details
    

    Die Ausgabe enthält Informationen zu Ihren Clusterversionen.

  2. Prüfen Sie anhand der ausgegebenen Ausgabe, ob folgende Probleme vorliegen, und beheben Sie sie gegebenenfalls.

    • Wenn die aktuelle Version des Administratorclusters um mehr als eine Nebenversion tiefer als die TARGET_VERSION ist, aktualisieren Sie alle Cluster auf genau eine Nebenversion tiefer als TARGET_VERSION.

    • Wenn die gkectl-Version niedriger als 1.11 ist und Sie ein Upgrade auf 1.12.x durchführen möchten, müssen Sie mehrere Upgrades ausführen. Upgraden Sie jeweils eine Nebenversion auf einmal bis Sie zu 1.11.x gelangen und fahren Sie dann mit der Anleitung in diesem Thema fort.

    • Wenn die gkectl-Version niedriger als TARGET_VERSION ist, aktualisieren Sie die Administrator-Workstation auf TARGET_VERSION.

  3. Wenn Sie festgestellt haben, dass die gkectl- und Clusterversionen für ein Upgrade geeignet sind, laden Sie das Bundle herunter.

    Prüfen Sie, ob das Bundle-Tarball bereits auf der Administrator-Workstation vorhanden ist.

    stat /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz

    Wenn sich das Bundle nicht auf der Administrator-Workstation befindet, laden Sie es herunter.

    gcloud storage cp gs://gke-on-prem-release/gke-onprem-bundle/TARGET_VERSION/gke-onprem-vsphere-TARGET_VERSION.tgz /var/lib/gke/bundles/
    

  4. Installieren Sie das Bundle.

    gkectl prepare --bundle-path /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz --kubeconfig ADMIN_CLUSTER_KUBECONFIG
    

    Ersetzen Sie ADMIN_CLUSTER_KUBECONFIG durch den Pfad Ihrer kubeconfig-Datei. Sie können dieses Flag auslassen, wenn sich die Datei im aktuellen Verzeichnis befindet und den Namen kubeconfig hat.

  5. Listen Sie die verfügbaren Clusterversionen auf und prüfen Sie, ob die Zielversion in den verfügbaren Nutzerclusterversionen enthalten ist.

    gkectl version --kubeconfig ADMIN_CLUSTER_KUBECONFIG --details

Sie können jetzt einen Nutzercluster in der Zielversion erstellen oder einen Nutzercluster auf die Zielversion aktualisieren.

Fehlerbehebung beim Upgrade

Sollten bei der empfohlenen Umstellung Probleme auftreten, beachten Sie bitte diese Empfehlungen, um sie zu beheben. Diese Vorschläge setzen voraus, dass Sie mit der Version 1.11.x.-Einrichtung begonnen haben und das empfohlene Upgrade-Verfahren durchlaufen.

Siehe auch Fehlerbehebung beim Erstellen und Upgraden von Clustern.

Fehlerbehebung bei Problemen mit dem Nutzercluster-Upgrade

Angenommen, Sie finden beim Upgraden eines Nutzerclusters ein Problem mit der Upgradeversion. Sie stellen fest, dass das Problem in einer zukünftigen Patchversion behoben wird. Gehen Sie dazu so vor:

  1. Für die Produktion verwenden Sie weiterhin die aktuelle Version.
  2. Testen Sie den Patchrelease in einem Nicht-Produktionscluster, wenn er veröffentlicht wird.
  3. Aktualisieren Sie alle Produktionsnutzercluster auf die Patchrelease-Version, wenn Sie sicher sind.
  4. Aktualisieren Sie den Administratorcluster auf die Patchrelease-Version.

Fehlerbehebung bei Problemen mit dem Upgrade eines Administratorclusters

Wenn beim Upgrade des Administratorclusters ein Problem auftritt, wenden Sie sich bitte an den Google-Support, um das Problem mit dem Administratorcluster zu beheben.

Mit dem neuen Upgrade-Ablauf können Sie weiterhin von neuen Nutzerclusterfunktionen profitieren, ohne von der Aktualisierung des Administratorclusters zu profitieren. So können Sie die Upgradehäufigkeit des Administratorclusters bei Bedarf verringern. Das Upgrade kann so ausgeführt werden:

  1. Führen Sie ein Upgrade der Produktionsnutzercluster auf 1.12.x durch.
  2. Behalten Sie die frühere Version des Administratorclusters bei und erhalten Sie weiterhin Sicherheitspatches.
  3. Testen Sie das Upgrade des Administratorclusters in einer Testumgebung von 1.11.x auf 1.12.x und melden Sie Probleme, falls vorhanden.
  4. Wenn das Problem durch eine Patch-Version 1.12.x behoben wurde, können Sie den Produktions-Administratorcluster auf diese Patch-Version aktualisieren, falls gewünscht.

Bekannte Probleme bei aktuellen Versionen

Die folgenden bekannten Probleme können Auswirkungen auf Upgrades haben, wenn Sie ein Upgrade von Version 1.7 oder höher ausführen.

Weitere Informationen finden Sie im Hilfeartikel Bekannte Probleme.

Das Upgrade der Administrator-Workstation kann fehlschlagen, wenn das Datenlaufwerk fast voll ist

Wenn Sie die Administrator-Workstation mit dem Befehl gkectl upgrade admin-workstation aktualisieren, schlägt das Upgrade möglicherweise fehl, wenn das Datenlaufwerk fast voll ist. Dies liegt daran, dass das System versucht, die aktuelle Administrator-Workstation lokal zu sichern, während ein Upgrade auf eine neue Administrator-Workstation durchgeführt wird. Wenn Sie nicht genügend Speicherplatz auf dem Datenlaufwerk löschen können, verwenden Sie den Befehl gkectl upgrade admin-workstation mit dem zusätzlichen Flag --backup-to-local=false, um eine lokale Sicherung der aktuellen Administrator-Workstation zu verhindern.

Unterbrechung für Arbeitslasten mit PodDisauseBudgets

Das Upgrade von Clustern kann zu Unterbrechungen oder Ausfallzeiten bei Arbeitslasten führen, die PodDisruptionBudgets (PDBs) verwenden.

Knoten schließen ihren Upgradeprozess nicht ab

Wenn Sie PodDisruptionBudget-Objekte konfiguriert haben, die keine zusätzlichen Unterbrechungen zulassen, werden Knotenupgrades nach wiederholten Versuchen möglicherweise nicht auf die Version der Steuerungsebene aktualisiert. Zur Vermeidung dieses Fehlers empfehlen wir eine vertikale Skalierung von Deployment oder HorizontalPodAutoscaler, damit der Knoten unter Berücksichtigung der PodDisruptionBudget-Konfiguration entleert wird.

So rufen Sie alle PodDisruptionBudget-Objekte auf, die keine Störungen zulassen:

kubectl get poddisruptionbudget --all-namespaces -o jsonpath='{range .items[?(@.status.disruptionsAllowed==0)]}{.metadata.name}/{.metadata.namespace}{"\n"}{end}'

Anhang

Informationen zu den in Version 1.1.0-gke.6 aktivierten DRS-Regeln von VMware

Ab Version 1.1.0-gke.6 erstellt Google Distributed Cloud automatisch Anti-Affinitätsregeln des Typs Distributed Resource Scheduler (DRS) für die Knoten Ihres Nutzerclusters, sodass sie auf mindestens drei physische Hosts in Ihrem Rechenzentrum verteilt werden. Ab Version 1.1.0-gke.6 wird diese Funktion automatisch für neue und vorhandene Cluster aktiviert.

Prüfen Sie vor dem Upgrade, ob Ihre vSphere-Umgebung die folgenden Bedingungen erfüllt:

Wenn Ihre vSphere-Umgebung nicht die vorherigen Bedingungen erfüllt, können Sie trotzdem ein Upgrade ausführen. Wenn Sie jedoch einen Nutzercluster von 1.3.x auf 1.4.x aktualisieren möchten, müssen Sie Anti-Affinitätsgruppen deaktivieren. Weitere Informationen finden Sie in diesem bekannten Problem der Google Distributed Cloud-Versionshinweise.

Informationen zu Ausfallzeiten bei Upgrades

Ressource Beschreibung
Administratorcluster

Wenn ein Administratorcluster ausfällt, werden die Steuerungsebenen und Arbeitslasten von Nutzerclustern weiterhin ausgeführt, es sei denn, sie sind von einem Fehler betroffen, der die Ausfallzeit verursacht hat.

Nutzercluster-Steuerungsebene

Normalerweise sollten Sie keine nennenswerten Ausfallzeiten für Nutzercluster-Steuerungsebenen erwarten. Lang andauernde Verbindungen zum Kubernetes API-Server können jedoch unterbrochen werden und müssen neu hergestellt werden. In diesen Situationen sollte der API-Aufrufer noch einmal versuchen, eine Verbindung herzustellen. Im schlimmsten Fall kann es während eines Upgrades bis zu einer Minute dauern.

Nutzerclusterknoten

Wenn für ein Upgrade eine Änderung der Nutzerclusterknoten erforderlich ist, werden die Knoten von Google Distributed Cloud schrittweise neu erstellt und die auf diesen Knoten ausgeführten Pods neu geplant. Sie können Auswirkungen auf Ihre Arbeitslasten verhindern, wenn Sie die entsprechenden PodDisruptionBudgets und Anti-Affinitätsregeln konfigurieren.

Neuerstellung einer Informationsdatei, falls sie fehlt

Wenn die Ausgabeinformationsdatei für Ihre Administrator-Workstation fehlt, müssen Sie diese Datei neu erstellen, damit Sie mit dem Upgrade fortfahren können. Diese Datei wurde bei der anfänglichen Erstellung Ihrer Workstation erstellt. Wenn Sie seitdem ein Upgrade ausgeführt haben, wurde sie mit neuen Informationen aktualisiert.

Die Datei mit den Ausgabeinformationen hat folgendes Format:

Admin workstation version: GKEADM_VERSION
Created using gkeadm version: GKEADM_VERSION
VM name: ADMIN_WS_NAME
IP: ADMIN_WS_IP
SSH key used: FULL_PATH_TO_ADMIN_WS_SSH_KEY
To access your admin workstation:
ssh -i FULL-PATH-TO-ADMIN-WS-SSH-KEY ubuntu@ADMIN-WS-IP

Hier sehen Sie ein Beispiel für eine Ausgabeinformationsdatei:

Admin workstation version: v1.10.3-gke.49
Created using gkeadm version: v1.10.3-gke.49
VM name: admin-ws-janedoe
IP: 172.16.91.21
SSH key used: /usr/local/google/home/janedoe/.ssh/gke-admin-workstation
Upgraded from (rollback version): v1.10.0-gke.194
To access your admin workstation:
ssh -i /usr/local/google/home/janedoe/.ssh/gke-admin-workstation ubuntu@172.16.91.21

Erstellen Sie die Datei in einem Editor und ersetzen Sie die entsprechenden Parameter. Speichern Sie die Datei mit einem Dateinamen, der mit dem VM-Namen in dem Verzeichnis übereinstimmt, in dem gkeadm ausgeführt wird. Wenn der VM-Name beispielsweise admin-ws-janedoe lautet, speichern Sie die Datei als admin-ws-janedoe.

Nächste Schritte