Für Distributed Cloud Connected-Cluster wird eine lokale Steuerungsebene verwendet, die auf Ihrer mit Distributed Cloud verbundenen Hardware bereitgestellt wird. Wenn die Verbindung zu Google Cloudunterbrochen wird, wechseln Ihre Cluster in den Notfallbetrieb und Ihre Arbeitslasten werden bis zu 7 Tage lang weiter ausgeführt. Wenn eine Arbeitslast ausfällt, während sich der Cluster im Notfallbetrieb befindet, sorgt das lokale Image-Caching dafür, dass die Arbeitslast wieder hochgefahren wird, wenn die Verbindung Google Cloud wiederhergestellt wird.
Ein Cluster kann aufgrund eines Hardware- oder Softwarefehlers, der außerhalb der Kontrolle von Google liegt, oder aufgrund eines Fehlers in der mit Distributed Cloud verbundenen Hardware oder Software in den Survivability-Modus wechseln.
Beispiele für Fehler, die nicht von Google verursacht wurden:
- Fehler bei der Internetverbindung am Bereitstellungsort.
- Fehlkonfiguration der Firewall oder des Netzwerks oder Hardwarefehler am Bereitstellungsort.
- Die Boundary-Proxy-Instanz, die den Cluster bereitstellt, wird heruntergefahren oder ist falsch konfiguriert.
Wenn Ihr Distributed Cloud Connected-Cluster aufgrund eines Hardware- oder Softwarefehlers, der außerhalb der Kontrolle von Google liegt, für maximal 7 Tage im Survivability-Modus betrieben wird, arbeitet der Google-Support mit Ihnen zusammen, um den normalen Betrieb bis zum 7. Tag wiederherzustellen. Nach Ablauf der 7 Tage wird kein weiterer Support garantiert.
Beispiele für Fehler in der mit Distributed Cloud verbundenen Hardware oder Software:
- Ein fehlerhaftes Softwareupdate für Distributed Cloud Connected.
- Ein Fehler auf der mit Distributed Cloud verbundenen Maschine oder der Netzwerkhardware.
- Ein nicht diagnostizierter Fehler in der Distributed Cloud Connected-Software.
Wenn Ihr mit Distributed Cloud verbundener Cluster aufgrund eines Fehlers in der mit Distributed Cloud verbundenen Software oder Hardware in den Survivability-Modus wechselt, arbeitet der Google-Support mit Ihnen zusammen, bis der Cluster wieder normal funktioniert.
Was passiert, wenn ein Cluster in den Survivability-Modus wechselt?
Wenn ein mit Distributed Cloud verbundener Cluster in den Survivability-Modus wechselt, passiert Folgendes:
- Google erstellt automatisch ein Support-Ticket für Ihre Distributed Cloud Connected-Bereitstellung. Dazu werden die Kontaktdaten verwendet, die Sie bei der Bestellung der Distributed Cloud Connected-Hardware angegeben haben.
- Sie werden per E-Mail darüber informiert, dass der Cluster in den Survivability-Modus gewechselt ist und ein Supportfall erstellt wurde.
- Der Google-Support hilft Ihnen dabei, den normalen Betrieb Ihres Clusters wiederherzustellen.
Clusterbetrieb im Notfallbetrieb
Im Survivability-Modus funktioniert ein Distributed Cloud Connected-Cluster so:
- Wenn die Verbindung zu Google Cloud unterbrochen wird, versucht Distributed Cloud Connected kontinuierlich, die Verbindung zu Google Cloud wiederherzustellen.
- Die Steuerung von Arbeitslasten über die Google Cloud CLI, die
kubectl-Befehlszeile und die Distributed Cloud Edge Container API ist deaktiviert. Sie können jedoch Offlineanmeldedaten generieren, um über eine alternative Internetverbindung auf Ihre Cluster zuzugreifen. Weitere Informationen finden Sie unter Anmeldedaten für einen Cluster abrufen. - Softwareupdates für Distributed Cloud, SLOs und Hardware-Reparaturen sind nicht verfügbar.
- Nachdem die Verbindung zu Google Cloud wiederhergestellt wurde, werden nur eingeschränkte Logs und Messwerte mit Google Cloud synchronisiert:
- Systemmesswerte sind auf 6 GB oder 22 Stunden begrenzt, je nachdem, welches Limit zuerst erreicht wird.
- Arbeitslastlogs sind auf 4 Stunden begrenzt.
- Arbeitslastmesswerte sind auf 1 GB begrenzt.
- Audit-Logs sind auf 10 GB begrenzt.
- Wenn ein Knoten neu gestartet wird, während der Cluster von Google Cloudgetrennt ist, kann er dem Cluster erst wieder beitreten, wenn die Verbindung zu Google Cloud wiederhergestellt ist, da sein Authentifizierungsschlüssel nicht aktualisiert werden kann. Sie haben die Möglichkeit, ein Offline-Neustartfenster anzugeben, in dem ein Knoten nach dem Neustart wieder einem Cluster beitreten kann, während der Cluster im Survivability-Modus ausgeführt wird. Weitere Informationen finden Sie unter Cluster erstellen.
Was ist zu tun, wenn ein Cluster den Survivability-Modus verlässt?
Wenn ein Distributed Cloud Connected-Cluster den Survivability-Modus verlässt, prüfen Sie Folgendes:
- Softwareversion von Distributed Cloud Connected: Möglicherweise müssen Sie den betroffenen Cluster auf die neueste Version der Software mit Verbindung zu Distributed Cloud aktualisieren, sofern Sie den Cluster nicht bewusst an eine bestimmte Softwareversion angepinnt haben. Weitere Informationen finden Sie unter Softwareversion eines Clusters aktualisieren.
- Zertifikate für die Flottenverwaltung Möglicherweise müssen Sie Ihre abgelaufenen LOAS-Zertifikate für die Flottenverwaltung aktualisieren. Wenden Sie sich in diesem Fall an den Google-Support.
Verbindungsstatus eines Clusters prüfen
Sie können den Status Ihres Distributed Cloud-Clusters Google Cloudprüfen, indem Sie die Schritte unter Informationen zu einem Cluster abrufen ausführen.
Der Befehl gibt den Wert für das Feld connectionState zurück. Dieses Feld kann einen der folgenden Werte haben:
CONNECTED: Der Cluster ist mit Google Cloudverbunden und vollständig synchronisiert.DISCONNECTED: Der Cluster ist nicht mit Google Cloudverbunden.CONNECTED_AND_SYNCING: Der Cluster hat die Verbindung zu Google Cloud wiederhergestellt und synchronisiert Offlinedaten mit Google Cloud. Trennen Sie diesen Cluster nicht von Google Cloud , bis die Synchronisierung abgeschlossen ist.