In einer Google Distributed Cloud-Implementierung hat die Steuerungsebenen-VM für einen Administratorcluster zwei angehängte Laufwerke:
Das Bootlaufwerk hat das Betriebssystem für die VM.
Das Datenlaufwerk hat Anmeldedaten und die etcd-Datenbank, die den Status des Administratorclusters speichert. Das heißt, auf dem Datenlaufwerk werden alle Kubernetes-Objekte für den Administratorcluster gespeichert.
Auf dieser Seite wird gezeigt, wie Sie eine Wiederherstellung durchführen können, wenn die VM der Steuerungsebene verloren geht oder das Bootlaufwerk manipuliert wird. Beispiel:
- Das Bootlaufwerk wird aufgrund von Spam-Journallogs schreibgeschützt.
- Das Dateisystem des Docker-Overlays wird beschädigt.
Die Wiederherstellung des Datenlaufwerks wird auf dieser Seite nicht behandelt. Eine Anleitung zum Wiederherstellen des Datenlaufwerks finden Sie unter Administratorcluster wiederherstellen.
VM der Steuerungsebene reparieren
Die Schritte, die Sie zum Reparieren der VM der Steuerungsebene des Administratorclusters ausführen, unterscheiden sich geringfügig, je nachdem, ob Sie einen Administratorcluster mit Hochverfügbarkeit (HA) oder einen Administratorcluster ohne HA haben.
HA
Ein HA-Administratorcluster hat drei VMs für die Steuerungsebene. Sie benötigen mindestens zwei VMs, um die Cluster-Steuerungsebene zu starten. Wenn drei VMs ausgefallen sind, reparieren Sie die ausgefallenen VMs einzeln. Nachdem die zweite VM repariert wurde und ausgeführt wird, sollte die Steuerungsebene des Clusters wieder verfügbar sein.
Führen Sie dazu diesen Befehl aus:
gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Ersetzen Sie Folgendes:
ADMIN_CLUSTER_CONFIGdurch den Pfad Ihrer Konfigurationsdatei für den Administratorcluster.ADMIN_CLUSTER_KUBECONFIGdurch den Pfad der kubeconfig-Datei Ihres Administratorclusters.
Die Ausgabe dieses Befehls sieht in etwa so aus:
Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM. [1] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:51.815518 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk [2] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.228252 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk [3] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.210705 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk Please enter your numeric choice:Geben Sie die Nummer der VM ein, die Sie reparieren möchten. Wenn die VM nicht in der Ausgabe angezeigt wird, wenden Sie sich an den Google Cloud Support.
Wenn Sie drei VMs haben, die repariert werden müssen, gibt
gkectl repair admin-masternach der Reparatur der ersten VM eine Fehlermeldung ähnlich der folgenden aus:If you are repairing admin control plane VM for HA admin cluster, it's possible that the API server is still down after repairing one of the VMs. Try continue fixing other control plane VMs listed to recover the quorum of control plane.Führen Sie in diesem Fall den Befehl noch einmal aus, um die zweite VM zu reparieren.
Ohne Hochverfügbarkeit
Führen Sie dazu diesen Befehl aus:
gkectl repair admin-master \ --config ADMIN_CLUSTER_CONFIG \ --kubeconfig ADMIN_CLUSTER_KUBECONFIG
Ersetzen Sie Folgendes:
ADMIN_CLUSTER_CONFIGdurch den Pfad Ihrer Konfigurationsdatei für den Administratorcluster.- Ersetzen Sie
ADMIN_CLUSTER_KUBECONFIGdurch den Pfad derkubeconfig-Datei Ihres Administratorclusters.
Die VM der Steuerungsebene des Administratorclusters wird in eine VM-Vorlage geklont, die über alle Informationen verfügt, die zum erneuten Erstellen der VM erforderlich sind. Der Befehl gkectl repair admin-master verwendet die VM-Vorlage zum Erstellen einer neuen VM. Dann werden ein neues Bootlaufwerk und das vorhandene Datenlaufwerk angehängt.
Wenn Ihre Clusterknoten ihre Adressen von einem DHCP-Server beziehen, hat die neue VM möglicherweise eine andere IP-Adresse als die ursprüngliche VM.
Nächste Schritte
- Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.
Weitere Informationen zu Supportressourcen finden Sie unter Support. Dazu gehören:
- Anforderungen für das Eröffnen eines Supportfalls.
- Tools zur Fehlerbehebung, z. B. Logs und Messwerte.
- Unterstützte Komponenten, Versionen und Funktionen von Google Distributed Cloud für VMware (nur Software).