Hostereignisse für mehrere Reservierungen verwalten

In diesem Dokument wird beschrieben, wie Sie die Hostwartungsfunktionen verwenden, die in AI Hypercomputer verfügbar sind. Hier erfahren Sie, wie Sie die reservierten Kapazitätsblöcke überwachen, planen und warten. Informationen zum Verwalten der Wartung Ihrer Compute Engine-Instanzen finden Sie unter Hostereignisse für Compute-Instanzen verwalten.

Sie können anstehende Hostwartungsereignisse für Ihre reservierten Kapazitätsblöcke proaktiv verwalten, unabhängig davon, ob Instanzen darauf ausgeführt werden. So lassen sich Störungen minimieren und die optimale Leistung aufrechterhalten.

Hinweise

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

In the Google Cloud console, activate Cloud Shell.

Activate Cloud Shell

At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

REST

Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.

    Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:

    gcloud init

    Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Verwalten von Hostwartungsereignissen für Reservierungen benötigen:

  • Compute-Administrator (roles/compute.admin) für das Projekt
  • Für schreibgeschützten Zugriff auf Audit-Logs zu Systemereignissen: Logbetrachter (roles/logging.viewer) für das Projekt

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Verwalten von Hostwartungsereignissen für Reservierungen erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um Hostwartungsereignisse für mehrere Reservierungen zu verwalten:

  • So starten Sie die Hostwartung für eine Reservierung: compute.reservations.performMaintenance im Projekt
  • So starten Sie die Hostwartung für einen Reservierungsblock: compute.reservationBlocks.performMaintenance im Projekt
  • So starten Sie die Hostwartung für einen Reservierungsunterblock: compute.reservationSubBlocks.performMaintenance im Projekt
  • So zeigen Sie eine Liste der Reservierungen an: compute.reservations.list im Projekt
  • So zeigen Sie die Details einer Reservierung an: compute.reservations.get im Projekt
  • So zeigen Sie eine Liste der Blöcke in einer Reservierung an: compute.reservationBlocks.list im Projekt
  • So rufen Sie eine Liste der Unterblöcke in einem Reservierungsblock auf: compute.reservationSubBlocks.list im Projekt

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Übersicht

Lesen Sie den Artikel Hostwartung verstehen und durchführen, falls Sie dies noch nicht getan haben.

So optimieren Sie die Wartung Ihrer reservierten Kapazitätsblöcke:

  1. Benachrichtigungen einrichten Sie können logbasierte Benachrichtigungen erstellen, um über geplante, gestartete oder abgeschlossene Wartungsereignisse für eine Reservierung, einen Reservierungsblock oder einen Reservierungsunterblock benachrichtigt zu werden. So können Sie Ihre Aktivitäten proaktiv planen und unerwartete Ausfallzeiten vermeiden.

  2. Wartung für Kapazitätsblöcke verwalten: Sie können sich die Wartung für Ihre Reservierungen, Reservierungsblöcke oder Reservierungsunterblöcke ansehen und sie bei Bedarf manuell starten. Dieser Prozess hilft Ihnen, die Resilienz Ihrer Arbeitslasten gegenüber Hostfehlern zu erhöhen, Ausfallzeiten zu vermeiden und dafür zu sorgen, dass Ihre Anwendungen verfügbar bleiben.

Benachrichtigungen für Reservierungen einrichten

Sie können sich über geplante, gestartete oder abgeschlossene Wartungsereignisse für eine Reservierung, einen Reservierungsblock oder einen Reservierungsunterblock benachrichtigen lassen, indem Sie logbasierte Benachrichtigungsrichtlinien erstellen.

So erstellen Sie eine Benachrichtigung für die Wartungsereignisse einer Reservierung, eines Reservierungsblocks oder eines Reservierungsunterblocks: Wiederholen Sie diesen Vorgang für jede Benachrichtigung, die Sie erstellen möchten.

  1. Rufen Sie in der Google Cloud Console das und die Seite Log-Explorer auf:

    Zum Log-Explorer

    Wenn Sie diese Seite über die Suchleiste suchen, wählen Sie das Ergebnis mit der Zwischenüberschrift Logging aus.

  2. Klicken Sie auf den Umschalter Abfrage anzeigen, um ihn zu aktivieren.

  3. Erstellen Sie im Bereich Abfrage eine der folgenden Abfragen. Mit diesen Abfragen werden Logeinträge gefiltert, um bestimmte Wartungsereignisse zu identifizieren. Wiederholen Sie diesen Vorgang für jede Abfrage, die Sie erstellen möchten.

    • Wartungsbenachrichtigungen für eine Reservierung erhalten:

      • So erhalten Sie Benachrichtigungen, wenn eine Wartung geplant ist:

        protoPayload.methodName="compute.reservations.upcomingGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "scheduled"
        
      • So erhalten Sie Benachrichtigungen, wenn die Wartung abgeschlossen ist:

        protoPayload.methodName="compute.reservations.completedGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "completed"
        
    • Wartungsbenachrichtigungen für einen Reservierungsblock erhalten:

      • So erhalten Sie Benachrichtigungen, wenn eine Wartung geplant ist:

        protoPayload.methodName="compute.reservations.block.upcomingGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "scheduled"
        
      • So erhalten Sie Benachrichtigungen, wenn die Wartung begonnen hat:

        protoPayload.methodName="compute.reservations.block.startGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "started"
        
      • So erhalten Sie Benachrichtigungen, wenn die Wartung abgeschlossen ist:

        protoPayload.methodName="compute.reservations.block.completedGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "completed"
        
    • Wartungsbenachrichtigungen für einen Reservierungsunterblock von A4X Max- oder A4X-Instanzen erhalten:

      • So erhalten Sie Benachrichtigungen, wenn eine Wartung geplant ist:

        protoPayload.methodName="compute.reservations.subBlock.upcomingGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "scheduled"
        
      • So erhalten Sie Benachrichtigungen, wenn die Wartung begonnen hat:

        protoPayload.methodName="compute.reservations.subBlock.startGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "started"
        
      • So erhalten Sie Benachrichtigungen, wenn die Wartung abgeschlossen ist:

        protoPayload.methodName="compute.reservations.subBlock.completedGroupMaintenance" severity>=DEFAULT
        protoPayload.status.message =~ "completed"
        
      • So erhalten Sie Benachrichtigungen, wenn auf einer A4X Max- oder A4X-Maschine ein Fehler auftritt und Compute Engine mit der Wartung beginnt:

        protoPayload.methodName="compute.reservations.subblock.unusedmachinerepair" severity>=DEFAULT
        protoPayload.status.message =~ "maintenance"
        
      • So erhalten Sie Benachrichtigungen, wenn die Wartung einer A4X Max- oder A4X-Maschine, bei der ein Fehler aufgetreten ist, abgeschlossen ist:

        protoPayload.methodName="compute.reservations.subblock.unusedmachinerepaircomplete" severity>=DEFAULT
        protoPayload.status.message =~ "repaired"
        
  4. Klicken Sie zum Validieren der Abfrage auf Abfrage ausführen. Wenn die Abfrage gültig ist, werden im Bereich Abfrageergebnisse Logeinträge angezeigt, die mit der Abfrage übereinstimmen.

  5. Klicken Sie in der Symbolleiste für Abfrageergebnisse auf die Liste Aktionen und wählen Sie dann Logbenachrichtigung erstellen aus. Der Bereich Logbasierte Benachrichtigungsrichtlinie erstellen wird angezeigt.

  6. Führen Sie im Abschnitt Benachrichtigungsdetails folgende Schritte aus:

    1. Geben Sie im Feld Name der Benachrichtigungsrichtlinie einen Namen für die Richtlinie ein.

    2. Wählen Sie in der Liste Schweregrad der Richtlinie die Option Warnung (oder einen höheren Schweregrad) aus.

    3. Klicken Sie auf Weiter.

  7. Klicken Sie im Bereich Logs auswählen, die in die Benachrichtigung aufgenommen werden sollen auf Weiter.

  8. Geben Sie im Abschnitt Benachrichtigungshäufigkeit und Dauer für automatisches Schließen festlegen Folgendes an:

    1. Wählen Sie in der Liste Zeit zwischen Benachrichtigungen aus, wie oft Sie benachrichtigt werden möchten.

    2. Wählen Sie in der Liste Dauer bis zur automatischen Schließung von Vorfällen aus, nach welcher Zeit Cloud Logging keine Benachrichtigungen mehr sendet und den Vorfall automatisch schließt.

    3. Klicken Sie auf Weiter.

  9. Geben Sie im Abschnitt Wer soll benachrichtigt werden? einen Benachrichtigungskanal für Logging an, an den Benachrichtigungen gesendet werden sollen.

  10. Klicken Sie auf Speichern.

Wartung für mehrere Reservierungen verwalten

So können Sie die Wartung für Ihre Reservierungen, Reservierungsblöcke und Reservierungsunterblöcke ansehen und steuern:

  • Wenn Sie den Status und die geplante Zeit der anstehenden Wartung für Ihre Reservierungen, Reservierungsblöcke oder Reservierungsunterblöcke prüfen möchten, sehen Sie sich den Wartungsstatus an.

  • Wenn Sie die Wartung für eine Reservierung, einen Reservierungsblock oder einen Reservierungsunterblock manuell starten möchten, anstatt auf das geplante Wartungsdatum und die geplante Wartungszeit zu warten, starten Sie die Wartung manuell.

  • Wenn Sie festlegen möchten, wie frühzeitig Sie Benachrichtigungen erhalten, wenn der Host einer Compute-Instanz nach einem Hostfehler oder einem fehlerhaften Hostbericht eine ungeplante Notfallwartung benötigt, verwalten Sie die Benachrichtigungen zur Hardware-Notfallwartung.

Wartungsstatus ansehen

Sie können den Status der bevorstehenden Wartung für eine Reservierung, einen Reservierungsblock oder einen Reservierungsunterblock abrufen, indem Sie den Wert des Felds upcomingGroupMaintenance in den Metadaten prüfen. Wenn eine Reservierung das Feld upcomingGroupMaintenance nicht enthält, ist für die Reservierung, den Reservierungsblock oder den Reservierungsunterblock keine Wartung geplant. Weitere Informationen zu den Feldern in upcomingGroupMaintenance finden Sie in der Compute Engine-Dokumentation unter Definitionen des Wartungsstatus.

Wenn außerdem Wartungsarbeiten für einen Reservierungsblock oder Unterblock geplant sind, enthält das Feld upcomingGroupMaintenance das Feld maintenanceReasons. In diesem Feld wird beschrieben, warum Wartungsarbeiten für Ihren Reservierungsblock oder Unterblock geplant wurden. Die möglichen Werte sind in der folgenden Tabelle aufgeführt:

Wartungstyp Wartungsgrund Status der Compute-Instanz
Geplante Wartung nach Meldung eines fehlerhaften Hosts FAILURE_GPU_CUSTOMER_REPORTED Gilt nur für Instanzen, die auf dem Host ausgeführt werden, den Sie als fehlerhaft gemeldet haben.
Geplante Wartung für die regelmäßige Wartung
  • PLANNED_UPDATE: Geplante Wartung der Infrastruktur
  • PLANNED_NETWORK_UPDATE: geplante Netzwerkwartung
Gilt für laufende, beendete oder angehaltene Instanzen.
Außerplanmäßige Wartung
  • FAILURE_DISK: Eine ungeplante Wartung, die aufgrund eines Fehlers auf einem Laufwerk, das an eine Instanz angehängt ist, geplant wurde.
  • FAILURE_GPU: ungeplante Wartung, die aufgrund eines GPU-bezogenen Fehlers geplant wurde.
  • FAILURE_GPU_TEMPERATURE: ungeplante Wartung aufgrund eines GPU-bezogenen Fehlers, nachdem die GPU eine hohe Temperatur erreicht hat.
  • FAILURE_GPU_XID: ungeplante Wartung, nachdem Sie aufgrund eines GPU-bezogenen Fehlers eine Xid-Meldung erhalten haben.
  • FAILURE_INFRA: Außerplanmäßige Wartung, die aufgrund eines Fehlers in der Infrastruktur geplant wurde.
  • FAILURE_INTERFACE: Ungeplante Wartung aufgrund eines Fehlers mit der NIC.
  • FAILURE_MEMORY: Eine ungeplante Wartung ist aufgrund eines Fehlers im Arbeitsspeicher einer Instanz geplant.
  • FAILURE_NETWORK: Aufgrund eines Fehlers im Netzwerk ist eine ungeplante Wartung geplant.
  • FAILURE_NVLINK: Ungeplante Wartung aufgrund eines Fehlers mit dem NVLink geplant.
Gilt nur für laufende Instanzen.

Wenn Sie das Feld maintenanceReasons in einem Reservierungsblock oder Unterblock aufrufen oder den Wartungsstatus eines Unterblocks ansehen möchten, müssen Sie die gcloud CLI oder die REST API verwenden. Wählen Sie andernfalls eine der folgenden Optionen aus:

Console

  1. Rufen Sie in der Google Cloud Console die Seite Reservierungen auf.

    Zu „Reservierungen“

  2. In der Spalte Wartungsstatus wird der Wartungsstatus Ihrer Reservierungen angezeigt. Wenn diese Spalte in der Tabelle On-Demand-Reservierungen nicht angezeigt wird, klicken Sie auf  Spaltenanzeigeoptionen, setzen Sie ein Häkchen bei Wartungsstatus und klicken Sie auf OK.

  3. So rufen Sie den Wartungsstatus eines Reservierungsblocks auf:

    1. Klicken Sie in der Spalte Name auf den Namen der Reservierung. Eine Seite mit den Details der Reservierung wird angezeigt.

    2. In der Tabelle Blöcke wird in der Spalte Wartung der Wartungsstatus der Blöcke in der Reservierung angezeigt.

gcloud

  1. Verwenden Sie zum Aufrufen des Wartungsstatus einer Reservierung den Befehl gcloud compute reservations describe, wobei das Flag --flatten auf resourceStatus.reservationMaintenance gesetzt ist:

    gcloud compute reservations describe RESERVATION_NAME \
        --flatten=resourceStatus.reservationMaintenance \
        --zone=ZONE
    

    Ersetzen Sie Folgendes:

    • RESERVATION_NAME: der Name der Reservierung.

    • ZONE: die Zone, in der die Reservierung vorhanden ist.

    Die Ausgabe sieht in etwa so aus:

    • Wenn für Ihre Reservierung eine Wartung geplant ist, sieht die Ausgabe etwa so aus:

      ---
      maintenanceOngoingCount: 0
      maintenancePendingCount: 6
      schedulingType: GROUPED
      upcomingGroupMaintenance:
        canReschedule: true
        maintenanceStatus: PENDING
        type: UNSCHEDULED
        windowEndTime: '2025-11-13T14:00:00.000-08:00'
        windowStartTime: '2025-11-13T12:00:00.000-08:00'
      

      Wenn das Feld schedulingType auf INDEPENDENT gesetzt ist, enthält das Feld upcomingGroupMaintenance nicht die Felder windowStartTime und windowEndTime. Wenn Sie sehen möchten, wann Wartungsarbeiten für eine Instanz geplant sind, die auf einem reservierten Host ausgeführt wird, rufen Sie den Wartungsstatus der Instanz auf.

    • Wenn für Ihre Reservierung keine Wartung geplant ist, sieht die Ausgabe in etwa so aus:

      ---
      schedulingType: GROUPED
      
  2. Wenn für Ihre Reservierung eine Wartung geplant ist, können Sie den Wartungsstatus der Blöcke in der Reservierung mit dem Befehl gcloud compute reservations blocks list aufrufen:

    gcloud compute reservations blocks list RESERVATION_NAME \
        --zone=ZONE
    

    Wenn für einen Reservierungsblock Wartungsarbeiten geplant sind oder gerade laufen, sieht die Ausgabe in etwa so aus:

    ---
    ...
    name: example-fr-a3u-dense-1-block-0001
    ...
    reservationBlockMaintenance:
      maintenanceOngoingCount: 0
      maintenancePendingCount: 6
      schedulingType: GROUPED
      upcomingGroupMaintenance:
        canReschedule: true
        maintenanceReasons:
        - PLANNED_UPDATE
        - PLANNED_NETWORK_UPDATE
        maintenanceStatus: PENDING
        type: UNSCHEDULED
        windowEndTime: '2025-11-13T14:00:00.000-08:00'
        windowStartTime: '2025-11-13T12:00:00.000-08:00'
    ...
    ---
    ...
    name: example-fr-a3u-dense-1-block-0002
    ...
    schedulingType: GROUPED
    ...
    
  3. Wenn für einen Reservierungsblock eine Wartung geplant ist, können Sie den Wartungsstatus von Unterblöcken innerhalb des Reservierungsblocks mit dem Befehl gcloud compute reservations sub-blocks list aufrufen:

    gcloud compute reservations sub-blocks list RESERVATION_NAME \
        --block-name=BLOCK_NAME \
        --zone=ZONE
    

    Ersetzen Sie BLOCK_NAME durch den Namen eines Blocks, der in der Reservierung vorhanden ist.

    Wenn für einen Reservierungsunterblock eine Wartung geplant ist oder gerade durchgeführt wird, sieht die Ausgabe in etwa so aus:

    ...
    reservationSubBlockMaintenance:
      instanceMaintenanceOngoingCount: 0
      instanceMaintenancePendingCount: 3
      maintenanceOngoingCount: 0
      maintenancePendingCount: 32
      schedulingType: GROUPED
      subblockInfraMaintenanceOngoingCount: 0
      subblockInfraMaintenancePendingCount: 0
      upcomingGroupMaintenance:
        canReschedule: true
        maintenanceReasons:
        - PLANNED_UPDATE
        - PLANNED_NETWORK_UPDATE
        maintenanceStatus: PENDING
        type: SCHEDULED
        windowEndTime: '2025-11-13T14:00:00.000-08:00'
        windowStartTime: '2025-11-13T12:00:00.000-08:00'
    ...
    

REST

  1. Wenn Sie den Wartungsstatus Ihrer Reservierungen aufrufen möchten, stellen Sie eine GET-Anfrage an eine der folgenden Methoden:

    Fügen Sie in die Anfrage-URL die folgenden Suchparameter ein:

    • Wenn Sie nur den Namen, den reservierten Maschinentyp und den Wartungsstatus einer Reservierung sehen möchten, fügen Sie den Abfrageparameter fields mit dem Wert items.name,items.specificReservation.instanceProperties.machineType,items.resourceStatus.reservationMaintenance ein.

    • Wenn Sie nur nach Reservierungen filtern möchten, in denen ein bestimmter Maschinentyp angegeben ist, fügen Sie den Abfrageparameter filter mit dem Wert specificReservation.instanceProperties.machineType:MACHINE_TYPE hinzu. Verwenden Sie dazu URL-codierte Werte.

    Wenn Sie beispielsweise Reservierungen in allen Zonen aufrufen möchten, stellen Sie eine GET-Anfrage:

    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/aggregated/reservations?fields=items.name,items.specificReservation.instanceProperties.machineType,items.resourceStatus.reservationMaintenance&filter=specificReservation.instanceProperties.machineType%3AMACHINE_TYPE
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die ID des Projekts, in dem die Reservierungen vorhanden sind.

    • MACHINE_TYPE: Der reservierte Maschinentyp, nach dem Sie Ihre Reservierungen filtern möchten.

    Wenn für eine Reservierung eine Wartung geplant ist oder gerade durchgeführt wird, sieht die Ausgabe in etwa so aus:

    {
      "items": [
        {
          "specificReservation": {
            "instanceProperties": {
              "machineType": "MACHINE_TYPE"
            }
          },
          "name": "example-reservation",
          "resourceStatus": {
            "reservationMaintenance": {
              maintenanceOngoingCount: 0,
              maintenancePendingCount: 6,
              "schedulingType": "GROUPED",
              "upcomingGroupMaintenance": {
                "type": "SCHEDULED",
                "canReschedule": true,
                "windowStartTime": "2025-11-13T12:00:00.000-08:00",
                "windowEndTime": "2025-11-13T14:00:00.000-08:00",
                "maintenanceStatus": "PENDING"
              }
            }
          }
        },
        ...
      ]
    }
    

    Optional können Sie die Liste der Compute-Instanzen weiter eingrenzen, indem Sie den Abfrageparameter filter auf einen anderen Filterausdruck festlegen.

  2. Wenn für Ihre Reservierung Wartungsarbeiten geplant sind, stellen Sie eine GET-Anfrage an die Methode reservationBlocks.list, um den Wartungsstatus der Blöcke in der Reservierung aufzurufen. Fügen Sie in der Anfrage-URL den Abfrageparameter fields ein, wobei dieser auf items.name,items.reservationMaintenance gesetzt ist:

    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/reservationBlocks?fields=items.name,items.reservationMaintenance
    

    Ersetzen Sie RESERVATION_NAME durch den Namen der Reservierung.

    Wenn für einen Reservierungsblock Wartungsarbeiten geplant sind oder gerade laufen, sieht die Ausgabe in etwa so aus:

    {
      "items": [
        {
          "name": "example-fr-a3u-dense-1-block-0001",
          "reservationBlockMaintenance": {
            "maintenanceOngoingCount": 0,
            "maintenancePendingCount": 6,
            "schedulingType": "GROUPED",
            "upcomingGroupMaintenance": {
              "type": "SCHEDULED",
              "canReschedule": true,
              "windowStartTime": "2025-11-13T12:00:00.000-08:00",
              "windowEndTime": "2025-11-13T14:00:00.000-08:00",
              "maintenanceStatus": "PENDING",
              "maintenanceReasons": [
                "PLANNED_UPDATE",
                "PLANNED_NETWORK_UPDATE"
              ]
            }
          }
        },
        ...
      ]
    }
    

    Wenn das Feld schedulingType für einen Block auf INDEPENDENT gesetzt ist, enthält das Feld upcomingGroupMaintenance nicht die Felder windowStartTime und windowEndTime. Wenn Sie sehen möchten, wann Wartungsarbeiten für eine Instanz geplant sind, die auf einem reservierten Block ausgeführt wird, rufen Sie den Wartungsstatus der Instanz auf.

  3. Wenn für einen Reservierungsblock Wartungsarbeiten geplant sind, können Sie den Wartungsstatus der Unterblöcke im Reservierungsblock mit einer GET-Anfrage an die Methode reservationSubBlocks.list aufrufen:

    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/reservationBlocks/BLOCK_NAME/reservationSubBlocks
    

    Ersetzen Sie BLOCK_NAME durch den Namen eines Blocks, der in der Reservierung vorhanden ist.

    Wenn für einen Reservierungsunterblock eine Wartung geplant ist oder gerade durchgeführt wird, sieht die Ausgabe in etwa so aus:

    {
      "items": [
        {
          "name": "example-fr-a3u-dense-1-block-0001",
          "reservationSubBlockMaintenance": {
            "instanceMaintenanceOngoingCount": 0,
            "instanceMaintenancePendingCount": 3,
            "maintenanceOngoingCount": 0,
            "maintenancePendingCount": 6,
            "schedulingType": "GROUPED",
            "subblockInfraMaintenanceOngoingCount": 0,
            "subblockInfraMaintenancePendingCount": 0,
            "upcomingGroupMaintenance": {
              "type": "SCHEDULED",
              "canReschedule": true,
              "windowStartTime": "2025-11-13T12:00:00.000-08:00",
              "windowEndTime": "2025-11-13T14:00:00.000-08:00",
              "maintenanceStatus": "PENDING",
              "maintenanceReasons": [
                "PLANNED_UPDATE",
                "PLANNED_NETWORK_UPDATE"
              ]
            }
          }
        },
        ...
      ]
    }
    

Wartung manuell starten

Sie können die Wartung für Ihre Reservierungen, Reservierungsblöcke oder Reservierungsunterblöcke manuell starten, anstatt auf den geplanten Zeitpunkt zu warten. Mit dieser Maßnahme können Sie Unterbrechungen Ihrer Arbeitslasten proaktiver steuern.

Je nach Wartungsstatus einer Reservierung, eines Reservierungsblocks oder eines Reservierungsunterblocks passiert Folgendes:

Wartungsstatus Beschreibung Was wird angezeigt?
Geplant Für die Reservierung ist eine planmäßige Wartung in Compute Engine vorgesehen. Sie können die Wartung vor dem geplanten Zeitpunkt manuell starten.
  • In der Google Cloud Console wird der Wartungsstatus als Bereit zur Ausführung – wird am DATE ausgeführt angezeigt.
  • In der gcloud CLI oder REST API setzt Compute Engine das Feld maintenanceStatus auf PENDING.
In Bearbeitung Die Wartung läuft. Sie können ihn nicht verschieben.
  • In der Google Cloud Console wird der Wartungsstatus als Wird ausgeführt angezeigt.
  • In der gcloud CLI oder REST API setzt Compute Engine das Feld maintenanceStatus auf ONGOING.
Abgeschlossen Die Wartung ist abgeschlossen. Compute Engine hat alle Wartungsbenachrichtigungen für die Instanz entfernt.
  • In der Google Cloud Console wird der Wartungsstatus als angezeigt.
  • In der gcloud CLI oder REST API ist das Feld maintenanceStatus nicht vorhanden.

Wenn Sie die Wartung auf bestimmten Hosts in einem Reservierungsblock oder in einem Reservierungsunterblock manuell starten möchten, verwenden Sie die gcloud CLI oder die REST API. Wählen Sie andernfalls eine der folgenden Optionen aus:

Console

  1. Rufen Sie in der Google Cloud Console die Seite Reservierungen auf.

    Zu „Reservierungen“

  2. Klicken Sie in der Spalte Name auf den Namen einer Reservierung. Eine Seite mit den Details der Reservierung wird angezeigt.

  3. Klicken Sie auf Wartung ausführen und wählen Sie eine der folgenden Optionen aus:

    • Wenn Sie die Wartung für alle Blöcke starten möchten, wählen Sie Alle Kapazitäten aus.

    • Wenn Sie die Wartung nur für Blöcke mit laufenden Instanzen starten möchten, wählen Sie In-use capacity (Kapazität in Verwendung) aus.

    • Wenn die Wartung nur für nicht verwendete Blöcke und Blöcke mit beendeten oder ausgesetzten Instanzen gestartet werden soll, wählen Sie Nicht verwendete Kapazität aus.

  4. Klicken Sie zur Bestätigung auf Ok.

gcloud

Ersetzen Sie Folgendes:

  • RESERVATION_NAME: der Name der Reservierung.

  • RESERVATION_MAINTENANCE_SCOPE: Der Wartungsumfang für die Reservierung. Geben Sie einen der folgenden Werte an:

    • So starten Sie die Wartung für alle Blöcke: all

    • So starten Sie die Wartung nur für Blöcke mit laufenden Instanzen: running

    • So starten Sie die Wartung nur für nicht verwendete Blöcke und Blöcke mit beendeten oder ausgesetzten Instanzen: unused

  • BLOCK_NAME: der Name eines Blocks, der in der Reservierung vorhanden ist.

  • SUB_BLOCK_NAME: der Name eines Unterblocks, der im Reservierungsblock vorhanden ist.

  • BLOCK_MAINTENANCE_SCOPE: Der Wartungsumfang für den Reservierungsblock. Geben Sie einen der folgenden Werte an:

    • So starten Sie die Wartung auf allen Hosts: all

    • So starten Sie die Wartung nur auf Hosts mit laufenden Instanzen: running

    • So starten Sie die Wartung nur auf nicht verwendeten Hosts und Hosts mit beendeten oder angehaltenen Instanzen: unused

  • ZONE: die Zone, in der die Reservierung vorhanden ist.

REST

  • Wenn Sie mit der Wartung einer Reservierung beginnen möchten, stellen Sie eine POST-Anfrage an die Methode reservations.performMaintenance:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/performMaintenance
    
    {
      "maintenanceScope": "RESERVATION_MAINTENANCE_SCOPE"
    }
    
  • Wenn Sie mit der Wartung eines Reservierungsblocks beginnen möchten, senden Sie eine POST-Anfrage an die Methode reservationBlocks.performMaintenance:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/reservationBlocks/BLOCK_NAME/performMaintenance
    
    {
      "maintenanceScope": "BLOCK_MAINTENANCE_SCOPE"
    }
    
  • Wenn Sie mit der Wartung eines Reservierungsunterblocks beginnen möchten, senden Sie eine POST-Anfrage an die Methode reservationSubBlocks.performMaintenance:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME/reservationBlocks/BLOCK_NAME/reservationSubBlocks/SUB_BLOCK_NAME/performMaintenance
    
    {
      "maintenanceScope": "BLOCK_MAINTENANCE_SCOPE"
    }
    

Ersetzen Sie Folgendes:

  • PROJECT_ID: die ID des Projekts, in dem Compute Engine die Reservierung automatisch erstellt hat.

  • ZONE: die Zone, in der die Reservierung vorhanden ist.

  • RESERVATION_NAME: der Name der Reservierung.

  • RESERVATION_MAINTENANCE_SCOPE: Der Wartungsumfang für die Reservierung. Geben Sie einen der folgenden Werte an:

    • So starten Sie die Wartung für alle Blöcke: ALL

    • So starten Sie die Wartung nur für Blöcke mit laufenden Instanzen: RUNNING

    • So starten Sie die Wartung nur für nicht verwendete Blöcke und Blöcke mit beendeten oder ausgesetzten Instanzen: UNUSED

  • BLOCK_NAME: der Name eines Blocks, der in der Reservierung vorhanden ist.

  • SUB_BLOCK_NAME: der Name eines Unterblocks, der im Reservierungsblock vorhanden ist.

  • BLOCK_MAINTENANCE_SCOPE: Der Wartungsumfang für den Reservierungsblock. Geben Sie einen der folgenden Werte an:

    • So starten Sie die Wartung auf allen Hosts: ALL

    • So starten Sie die Wartung nur auf Hosts mit laufenden Instanzen: RUNNING

    • So starten Sie die Wartung nur auf nicht verwendeten Hosts und Hosts mit beendeten oder angehaltenen Instanzen: UNUSED

Hardware-Notfallwartungsbenachrichtigungen verwalten

Wenn bei einer Instanz ein Hostfehler auftritt oder Sie den Host als fehlerhaft melden, ist eine ungeplante Notfallwartung des Hosts der Instanz erforderlich. Standardmäßig bietet Compute Engine einige Stunden im Voraus eine Benachrichtigung, wenn diese Art von Wartung geplant wird. Bei reservierten Hosts können Sie Benachrichtigungen über Notfallwartungen aktivieren, um diese Benachrichtigungsfrist auf mindestens sieben Tage zu verlängern. Mit diesem Ansatz können Sie Unterbrechungen Ihrer Arbeitslasten proaktiver steuern.

So aktivieren oder deaktivieren Sie Benachrichtigungen zur Notfallwartung von Hardware für eine Reservierung:

gcloud

  • Wenn Sie Benachrichtigungen zur Notfallwartung von Hardware für eine Reservierung aktivieren möchten, verwenden Sie den Befehl gcloud compute reservations update mit dem Flag --enable-emergent-maintenance:

    gcloud compute reservations update RESERVATION_NAME \
        --enable-emergent-maintenance \
        --zone=ZONE
    
  • Wenn Sie Benachrichtigungen zur Notfallwartung von Hardware für eine Reservierung deaktivieren möchten, verwenden Sie den Befehl gcloud compute reservations update mit dem Flag --no-enable-emergent-maintenance:

    gcloud compute reservations update RESERVATION_NAME \
        --no-enable-emergent-maintenance \
        --zone=ZONE
    

Ersetzen Sie Folgendes:

  • RESERVATION_NAME: der Name der Reservierung.

  • ZONE: die Zone, in der die Reservierung vorhanden ist.

REST

Wenn Sie Hardware-Notfallwartungsbenachrichtigungen für eine Reservierung aktivieren oder deaktivieren möchten, stellen Sie eine PATCH-Anfrage an die Methode reservations.update. Fügen Sie in der Anfrage-URL den Abfrageparameter paths ein, wobei dieser auf enableEmergentMaintenance gesetzt ist.

PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/reservations/RESERVATION_NAME?paths=enableEmergentMaintenance

{
  "name": "RESERVATION_NAME",
  "enableEmergentMaintenance": EMERGENCY_MAINTENANCE_NOTIFICATIONS
}

Ersetzen Sie Folgendes:

  • PROJECT_ID: die ID des Projekts, in dem die Reservierung vorhanden ist.

  • ZONE: die Zone, in der die Reservierung vorhanden ist.

  • RESERVATION_NAME: der Name der Reservierung.

  • EMERGENCY_MAINTENANCE_NOTIFICATIONS: Geben Sie einen der folgenden Werte an:

    • So aktivieren Sie Benachrichtigungen: true

    • So deaktivieren Sie Benachrichtigungen: false

Nächste Schritte