Auf dieser Seite werden Best Practices für eine hohe Verfügbarkeit Ihrer Google Distributed Cloud Connected-Installation beschrieben. Für Distributed Cloud Connected wird kein Service Level Agreement (SLA) angeboten. Es gilt nur das auf dieser Seite beschriebene Service Level Objective (SLO).
Verfügbarkeitsstufe auswählen und implementieren
Sie müssen die Verfügbarkeitsstufe für Ihre mit Distributed Cloud verbundenen Arbeitslasten auswählen, die Ihren Geschäftsanforderungen am besten entspricht. Beispielsweise hat eine Self-Checkout-Anwendung in einem Einzelhandelsgeschäft ein viel geringeres Verfügbarkeitsrisiko als eine Edge-RAN-Bereitstellung eines Mobilfunknetzbetreibers.
Die Zielverfügbarkeit ist direkt proportional zur Distributed Cloud-Ersatzressourcenkapazität, die Sie für Notfälle reservieren. In der folgenden Tabelle wird diese Beziehung beschrieben. Diese Schätzungen berücksichtigen nicht die Ausfallzeiten, die mit einem Wartungsfenster geplant sind.
Die Software von Distributed Cloud Connected verbraucht auf jeder physischen Maschine einige Ressourcen. Die Menge variiert je nach der spezifischen Konfiguration Ihrer mit Distributed Cloud verbundenen Bereitstellung. Google empfiehlt, die mit Distributed Cloud verbundene Bereitstellung zu benchmarken, um diesen Betrag zu messen und bei der Planung der Arbeitslastverteilung zu berücksichtigen.
| Mit GDC verbundener Formfaktor | Genutzte Kapazität | Reservierte Kapazität | Verfügbarkeit von Zielen |
|---|---|---|---|
| GDC Connected-Rack (einzelner Cluster mit 6 Maschinen) |
83,33% | 16,67% | 99,9 % |
| GDC Connected-Rack (einzelner Cluster mit 6 Maschinen) |
100 % | 0 % | 93,5% |
| Mit GDC verbundener Server (einzelner Cluster mit 3 Maschinen) |
66,6% | 33,3% | 99,9 % |
Aufgrund eines Hardwarefehlers oder eines Knotens, der neu gestartet werden muss, kann es zu einem plötzlichen Kapazitätsverlust kommen. Dazu müssen Sie Ihre Arbeitslasten unter Berücksichtigung von Ressourcenkontingenten entwerfen, damit Sie auf jedem mit Distributed Cloud verbundenen Knoten immer verfügbare Kapazität haben, die dem von Ihnen gewählten Verfügbarkeitsniveau entspricht.
Wenn Sie beispielsweise eine Zielverfügbarkeit von 99,9% für eine Bereitstellung mit einem mit Distributed Cloud verbundenen Rack erreichen möchten, müssen Sie Ihre Arbeitslasten so konfigurieren, dass eine der sechs physischen Maschinen in jedem mit Distributed Cloud verbundenen Cluster als Backup verfügbar ist.
Distributed Cloud-Zonen geografisch diversifizieren
Um die Auswirkungen potenzieller Fehler in der Steuerungsebene zu minimieren, empfehlen wir dringend, Ihre Distributed Cloud-Zonen auf mehrere benachbarte Regionen zu verteilen.
Überlebensmodus verwenden
Distributed Cloud-Cluster verwenden eine lokale Steuerungsebene, die auf Ihrer mit Distributed Cloud verbundenen Hardware ausgeführt wird. Ihre Arbeitslasten werden weiterhin ausgeführt, wenn die Verbindung zu Google Cloud unterbrochen wird. Weitere Informationen finden Sie unter Überlebensfähigkeitsmodus für Distributed Cloud Connected.
Softwareupdates und Wartungsfenster
Google aktualisiert die Distributed Cloud Connected-Software regelmäßig. Diese Softwareupdates sind obligatorisch und können nicht deaktiviert werden. Mit Distributed Cloud Connected können Sie für jeden Ihrer mit Distributed Cloud verbundenen Cluster individuelle Wartungszeiträume festlegen.
Mit Wartungsfenstern können Sie steuern, wann automatische Upgrades von Steuerungsebenen und Knoten stattfinden dürfen, um potenzielle vorübergehende Unterbrechungen Ihrer Arbeitslasten zu minimieren. Wartungsfenster sind unter anderem für die folgenden Szenarios hilfreich:
- Außerhalb der Hauptbetriebszeiten: Sie möchten die Wahrscheinlichkeit von Ausfallzeiten minimieren und automatische Upgrades außerhalb der Hauptbetriebszeiten planen, wenn der Traffic reduziert ist.
- Auf Abruf: Sie möchten, dass Upgrades während der Geschäftszeiten stattfinden, damit die Prozesse überwacht und unerwartete Probleme sofort behoben werden können.
- Multi-Cluster-Upgrades: Sie möchten Upgrades in mehreren Clustern in verschiedenen Regionen nacheinander und in bestimmten Intervallen durchführen.
Distributed Cloud Connected unterstützt die folgenden Arten von Wartungszeiträumen:
- Wartungsfenster Gibt ein Zeitfenster an, in dem Google Wartungsarbeiten und Software-Upgrades für Ihren mit Distributed Cloud verbundenen Cluster durchführen kann.
- Wartungsausschlussfenster: Gibt ein Zeitfenster an, in dem Google keine Wartungsarbeiten oder Softwareupgrades für Ihren mit Distributed Cloud verbundenen Cluster durchführen kann. Wenn Sie ein Wartungsausschlussfenster konfigurieren möchten, müssen Sie zuerst ein Wartungsfenster konfigurieren. Ein Wartungsausschluss hat Vorrang vor dem Wartungsfenster des Clusters.
Neben automatischen Upgrades muss Google gelegentlich weitere Wartungsaufgaben ausführen. In diesen Fällen wird das Wartungsfenster eines Clusters nach Möglichkeit berücksichtigt.
Wenn Aufgaben länger dauern als das Wartungsfenster geöffnet ist, versucht Distributed Cloud Connected, die Aufgaben zu pausieren. Anschließend wird versucht, diese Aufgaben während des nächsten Wartungsfensters fortzusetzen.
Distributed Cloud Connected behält sich das Recht vor, ungeplante Notfallupgrades außerhalb von Wartungsfenstern durchzuführen. Außerdem können obligatorische Upgrades von eingestellter oder veralteter Software automatisch außerhalb von Wartungsfenstern erfolgen.
Sie können Ihren Cluster auch jederzeit manuell aktualisieren. Manuell initiierte Upgrades werden unmittelbar und unabhängig von Wartungsfenstern ausgeführt.
Informationen zum Einrichten eines Wartungsfensters für einen neuen oder vorhandenen Cluster finden Sie unter Wartungsfenster konfigurieren.
Gestaffelte Softwareupdates
Um Ausfallzeiten von Arbeitslasten zu reduzieren, werden Softwareupdates für Distributed Cloud Connected gestaffelt. Mit anderen Worten: Google führt Upgrades für Worker-Knoten in jedem mit Distributed Cloud verbundenen Cluster stufenweise durch. Alle Worker-Knoten in einer Software-Upgrade-Phase werden gleichzeitig heruntergefahren.
Die Anzahl der Knoten in einer Software-Upgrade-Phase wird so bestimmt:
- Bereitstellungen mit bis zu 3 Racks:Jede Phase entspricht der Gesamtzahl der Maschinen in allen Racks geteilt durch 6 und auf die nächste Ganzzahl aufgerundet.
- Bereitstellungen mit mindestens vier Racks:Jede Phase ist die Gesamtzahl der Maschinen in allen Racks der Bereitstellung geteilt durch die Anzahl der Racks in der Bereitstellung.
Sie haben auch die Möglichkeit, die Größe der einzelnen Phasen des Softwareupgrades selbst festzulegen. Mit anderen Worten: Sie können die Anzahl der Knoten angeben, die in einem verbundenen Distributed Cloud-Cluster gleichzeitig für ein Software-Upgrade ausfallen können. Eine Anleitung finden Sie unter Knotenausfallzeiten bei Softwareupgrades verwalten.
Beschränkungen
Für Wartungsfenster gelten die folgenden Einschränkungen:
Ein Wartungsfenster pro Cluster: Sie können nur ein einziges Wartungsfenster pro Cluster konfigurieren. Durch die Konfiguration eines neuen Wartungsfensters wird das vorangegangene außer Kraft gesetzt.
Zeitzonen für Wartungsfenster Wenn Wartungsfenster konfiguriert und eingesehen werden, werden die Zeiten je nach verwendetem Tool unterschiedlich angezeigt, wie in den folgenden Abschnitten beschrieben.
Bei der Konfiguration von Wartungsfenstern
Wenn Sie das allgemeiner gehaltene Flag --maintenance-window zum Konfigurieren eines Wartungsfensters verwenden, können Sie keine Zeitzone angeben. Wenn Sie die Google Cloud CLI oder die API verwenden, werden Zeiten in UTC angezeigt. In derGoogle Cloud -Konsole werden Zeiten in der lokalen Zeitzone angezeigt.
Bei Verwendung detaillierterer Flags wie --maintenance-window-start können Sie die Zeitzone als Teil des Wertes angeben. Wenn Sie die Zeitzone weglassen, wird Ihre lokale Zeitzone verwendet. Uhrzeiten werden immer in UTC gespeichert.
Bei der Ansicht von Wartungsfenstern
Wenn Sie Informationen zu Ihrem Cluster ansehen, werden Zeitstempel für Wartungsfenster möglicherweise in UTC oder in Ihrer lokalen Zeitzone angezeigt. Dies ist davon abhängig, auf welche Weise Sie die Informationen anzeigen lassen:
- Wenn Sie Informationen zu Ihrem Cluster in der Google Cloud Console abrufen, werden die Zeiten immer entsprechend Ihrer lokalen Zeitzone angegeben.
- Wenn Sie Informationen zu Ihrem Cluster mit der gcloud CLI abrufen, werden die Zeiten immer in UTC angegeben.
In beiden Fällen ist die RRULE immer in UTC. Das heißt, wenn Sie beispielsweise Tage der Woche angeben, sind diese Tage in UTC angegeben.
Wartungsfenster für Cluster konfigurieren
Mit Distributed Cloud Connected können Sie für jeden Ihrer Distributed Cloud Connected-Cluster ein Wartungsfenster angeben. In diesem Zeitraum aktualisiert Google die Distributed Cloud-Software nur zu den von Ihnen angegebenen Zeiten und in der von Ihnen angegebenen Häufigkeit.
Für Wartungszeiträume für verbundene Cluster von Distributed Cloud gelten die folgenden Regeln:
- Wenn Sie ein Wartungsfenster für einen mit Distributed Cloud verbundenen Cluster angeben, aktualisiert Google Ihre mit Distributed Cloud verbundene Software 48 Stunden nach der Ankündigung des Updates über die Versionshinweise für mit Distributed Cloud verbundene Cluster. Auf der Seite mit den Versionshinweisen können Sie den RSS-Feed für die Versionshinweise zu Distributed Cloud Connected abonnieren, um über Softwareupdates informiert zu werden, sobald sie veröffentlicht werden.
- Die Mindestdauer eines Wartungsfensters beträgt sechs Stunden. Sie können je nach Komplexität Ihrer Distributed Cloud Connected-Installation und Ihren Geschäftsanforderungen einen längeren Zeitraum angeben.
- Die Mindesthäufigkeit von Software-Updates beträgt einmal pro Woche. Sie können entweder wöchentliche oder tägliche Wartungsfenster angeben. Sie können bestimmte Tage ein- und ausschließen.
- Sie können den Wartungsfensterplan für einen Cluster jederzeit ändern, es sei denn, ein Wartungsfenster wurde bereits geplant oder ist gerade aktiv.
- Wenn das Softwareupdate nicht innerhalb des angegebenen Zeitfensters abgeschlossen wird, wird es pausiert und dann während des nächsten geplanten Wartungsfensters fortgesetzt.
Eine ausführliche Anleitung finden Sie unter Wartungsfenster für einen Cluster konfigurieren.
Reparatur von ausgefallener Hardware
Wenn Google einen Fehler der mit Distributed Cloud verbundenen Hardware erkennt, führen wir einen der folgenden Schritte aus:
Bei Google-eigener Distributed Cloud-Hardware versucht Google, einen Vor-Ort-Termin innerhalb von drei Arbeitstagen zu vereinbaren. Damit ein von Google autorisierter Techniker die erforderlichen Diagnosen und Reparaturen durchführen kann, müssen Sie ihm Zugriff auf die mit Distributed Cloud verbundene Hardware gewähren.
Bei Distributed Cloud-Hardware, die dem Kunden gehört, benachrichtigt Google Sie über das Problem. Sie müssen sich an den SI wenden, der Ihre mit Distributed Cloud verbundene Hardware geliefert hat, um einen Technikertermin zu vereinbaren und die erforderlichen Diagnosen und Reparaturen durchzuführen.
Wenn ein Fehler bei der mit Distributed Cloud verbundenen Hardware auftritt, gilt eines der folgenden Szenarien, je nachdem, ob Ihre mit Distributed Cloud verbundene Hardware SED-Speicher (Self-Encrypting Disk) verwendet:
In Distributed Cloud Connected-Racks werden Daten auf Nicht-SED-Laufwerken gespeichert. Wenn Google oder ein Google-Partner-Systemintegrator Reparaturen vor Ort durchführt, werden alle Festplattenlaufwerke vor Beginn der Wartung aus dem betroffenen Distributed Cloud Connected-Gerät entfernt und für die Dauer der Reparatur in Ihre Obhut gegeben.
Auf Distributed Cloud-Servern werden Daten auf SED-Laufwerken gespeichert. Wenn eine Maschine ausfällt, wird sie von Google oder einem Google-Partner-SI ersetzt. Bevor die Maschine von Ihrem Standort entfernt wird, sorgt Google dafür, dass Ihre Daten sicher von allen Laufwerken gelöscht werden.
Andere Fehlerquellen
Sie sind für die folgenden Aspekte Ihrer Distributed Cloud-Installation verantwortlich, die außerhalb der Kontrolle von Google liegen und sich auf die Verfügbarkeit von Distributed Cloud Connected auswirken können:
- Alle Daten, die Sie auf mit Distributed Cloud verbundener Hardware speichern. Dazu gehören funktionierende redundante Back-ups und der Export Ihrer Daten, bevor Sie Ihre mit Distributed Cloud verbundene Hardware an Google zurücksenden.
- Stromversorgung:
- Umgebungstemperatur, Luftfeuchtigkeit und Kühlung.
- Physische Hardwaresicherheit:
- Sicherheit des lokalen Netzwerks
- Lokales Netzwerk und Internetverbindung. Distributed Cloud Connected muss alle 7 Tage eine neue Verbindung zu Google Cloud herstellen, um Sicherheitstokens und Verschlüsselungsschlüssel zu aktualisieren und Protokollierungs- und Verwaltungsdaten zu synchronisieren.