Anfrage für vorausschauende Reservierungen im Kalendermodus erstellen

In diesem Dokument wird erläutert, wie Sie eine Anfrage für vorausschauende Reservierungen im Kalendermodus erstellen. Mit diesen Anfragen können Sie Ressourcen mit hoher Nachfrage für das Erstellen von VM-Instanzen reservieren, die bis zu 90 Tage lang ausgeführt werden. Sie können beispielsweise vorausschauende Reservierungen im Kalendermodus verwenden, um GPU- oder TPU-Ressourcen für Ihre VMs zu reservieren.

Sie können Anfragen für vorausschauende Reservierungen im Kalendermodus verwenden, um Ressourcen mit hoher Nachfrage für die Ausführung der folgenden Arbeitslasten zu reservieren:

  • Jobs zum Vortrainieren von Modellen

  • Jobs zur Modellabstimmung

  • Arbeitslasten für HPC-Simulationen (High Performance Computing)

  • Kurzfristige Steigerungen der Inferenzarbeitslasten

Nachdem Google Cloud eine Anfrage im Kalendermodus genehmigt hat, stehen Ihnen die reservierten Ressourcen zur Verfügung, um GPU-, H4D- oder TPU-VMs zum angegebenen Lieferdatum und zur angegebenen Lieferzeit zu erstellen. Weitere Informationen zu den Anforderungen und Einschränkungen, die beim Erstellen einer Anfrage im Kalendermodus gelten, finden Sie unter Anfragen für vorausschauende Reservierungen im Kalendermodus – Übersicht.

Hinweise

  • Wenn Sie keine Anfragen für vorausschauende Reservierungen im Kalendermodus verwenden können, haben Sie möglicherweise keinen Zugriff auf diese Funktion. Wenden Sie sich in diesem Fall an Ihr Kontoteam oder das Vertriebsteam.
  • Wenn Sie Ihre reservierte Kapazität für andere Projekte in Ihrer Organisation freigeben möchten, muss das Projekt, in dem Sie Anfragen für vorausschauende Reservierungen im Kalendermodus erstellen möchten, für die Erstellung freigegebener Reservierungen zugelassen sein. Andernfalls treten Fehler auf.
  • Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei der Compute Engine authentifizieren:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:

      gcloud init

      Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

    2. Set a default region and zone.

    REST

    Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.

      Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:

      gcloud init

      Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

    Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen für das Projekt die IAM-Rolle Compute Future Reservation User (roles/compute.futureReservationUser) zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen einer zukünftigen Reservierungsanfrage im Kalendermodus benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen einer Anfrage für vorausschauende Reservierung im Kalendermodus erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um eine Anfrage für vorausschauende Reservierung im Kalendermodus zu erstellen:

  • So erstellen Sie eine zukünftige Reservierungsanfrage: compute.futureReservations.create für das Projekt
  • So werden von Compute Engine Reservierungen automatisch erstellt: compute.reservations.create für das Projekt
  • So sehen Sie die zukünftige Verfügbarkeit von Ressourcen: compute.advice.calendarMode im Projekt

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Übersicht

So erstellen Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus:

  1. Zukünftige Verfügbarkeit von Ressourcen ansehen Sehen Sie sich die zukünftige Verfügbarkeit der GPU-VMs, H4D-VMs oder TPUs an, die Sie reservieren möchten. Geben Sie dann beim Erstellen einer Anfrage die Anzahl, den Typ und die Reservierungsdauer der Ressourcen an, die Sie als verfügbar bestätigt haben. Google Cloud wird Ihre Anfrage mit größerer Wahrscheinlichkeit genehmigen, wenn Sie diese Informationen angeben.

  2. Reservierungsanfrage für GPU-VMs, H4D-VMs oder TPUs erstellen Erstellen und senden Sie eine Anfrage für vorausschauende Reservierung im Kalendermodus für GPU-VMs, H4D-VMs oder TPUs. Wenn Sie eine Anfrage erfolgreich erstellen können, genehmigt Google Cloudsie innerhalb einer Minute.

Zukünftige Verfügbarkeit von Ressourcen ansehen

So rufen Sie die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region auf:

  • Für GPU-VMs bis zu 60 Tage im Voraus
  • Für H4D-VMs bis zu 120 Tage im Voraus
  • Für TPUs bis zu 120 Tage im Voraus

Wählen Sie eine der folgenden Optionen aus, um die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region aufzurufen:

Console

Sie können die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region einsehen, wenn Sie im Kalendermodus eine Anfrage für eine vorausschauende Reservierung erstellen. Weitere Informationen finden Sie in diesem Dokument unter Reservierungsanfrage für GPU-VMs, H4D-VMs oder TPUs erstellen.

gcloud

Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region aufrufen möchten, verwenden Sie einen der folgenden gcloud beta compute advice calendar-mode-Befehle. Fügen Sie je nach den Ressourcen, die Sie aufrufen möchten, die folgenden Flags ein:

  • Wenn Sie die Verfügbarkeit von GPU-VMs oder H4D-VMs aufrufen möchten, fügen Sie die Flags --vm-count und --machine-type ein:

    gcloud beta compute advice calendar-mode \
        --vm-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    
  • Wenn Sie die TPU-Verfügbarkeit aufrufen möchten, fügen Sie die Flags --chip-count und --tpu-version ein:

    gcloud beta compute advice calendar-mode \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    

Ersetzen Sie Folgendes:

  • NUMBER_OF_VMS: die Anzahl der zu reservierenden VMs. Der Wert muss für GPU-VMs mindestens 1 und maximal 80 und für H4D-HPC-VMs 256 betragen.

  • MACHINE_TYPE: Der GPU- oder H4D-Maschinentyp, der reserviert werden soll. Geben Sie einen der folgenden Werte an:

    • Für A4-Maschinentypen: a4-highgpu-8g

    • Für A3 Ultra-Maschinentypen: a3-ultragpu-8g

    • Für A3 Mega-Maschinentypen: a3-megagpu-8g

    • Für A3-High-Maschinentypen mit 8 GPUs: a3-highgpu-8g

    • H4D-HPC-Maschinentypen: H4D-Maschinentypen

  • NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Der Wert muss 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024 sein.

  • TPU_VERSION: Die TPU-Version, die reserviert werden soll. Geben Sie einen der folgenden Werte an:

    • Für TPU7x: TPU7X

    • Für TPU v6e: V6E

    • Für TPU v5p: V5P

    • Für TPU v5e: V5E

    Wenn Sie eine TPU v5e angeben, müssen Sie das Flag --workload-type angeben. Legen Sie dieses Flag auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:

    • Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten (maschinelles Lernen), geben Sie BATCH an.

    • Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie SERVING an.

  • REGION: die Region, in der GPU-VMs, H4D-VMs oder TPUs reserviert werden sollen. Informationen dazu, welche Regionen und Zonen unterstützt werden, finden Sie unter Einschränkungen.

  • FROM_START_TIME und TO_START_TIME: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Ersetzen Sie Folgendes:

    • YYYY-MM-DD: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-) getrennt.

    • HH:MM:SS: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:) ist.

    • OFFSET: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie -08:00 an. Wenn Sie keinen Versatz verwenden möchten, geben Sie Z an.

  • FROM_END_TIME und TO_END_TIME: das früheste und das späteste Datum, an dem Ihre Kapazitätsreservierung enden soll. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel. Wenn Sie anstelle von Endzeiten einen Bereich von Dauern für den Reservierungszeitraum angeben möchten, ersetzen Sie das Flag --end-time-range durch das --duration-range-Flag.

Die Ausgabe sieht etwa so aus:

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-central1-a
      otherLocations:
        zones/us-central1-b:
          details: Recommendation in this zone is possible.
          status: RECOMMENDED
        zones/us-central1-c:
          details: Temporarily no free capacity in this zone in the
          requested time window.
          status: NO_CAPACITY
        zones/us-central1-f:
          details: This machine family is not supported in this zone.
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

Wenn die angeforderten Ressourcen verfügbar sind, enthält die Ausgabe die Felder startTime, endTime und location. In diesen Feldern werden die früheste Startzeit, die späteste Endzeit und die Zonen angegeben, in denen Ressourcen verfügbar sind.

REST

Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region aufrufen möchten, senden Sie eine GET-Anfrage an die Betamethode advice.calendarMode. Fügen Sie basierend auf den Ressourcen, die Sie aufrufen möchten, die folgenden Felder in den Anfragetext ein:

  • Wenn Sie die Verfügbarkeit von GPU-VMs oder H4D-VMs aufrufen möchten, fügen Sie die Felder instanceCount und machineType ein:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "specificSkuResources": {
              "instanceCount": "NUMBER_OF_VMS",
              "machineType": "MACHINE_TYPE"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    
  • Wenn Sie die TPU-Verfügbarkeit sehen möchten, fügen Sie die Felder acceleratorCount und vmFamily ein:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "aggregateResources": {
              "acceleratorCount": "NUMBER_OF_CHIPS",
              "vmFamily": "TPU_VERSION"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    

Ersetzen Sie Folgendes:

  • PROJECT_ID: die ID des Projekts, in dem Sie Ressourcen reservieren möchten.

  • REGION: die Region, in der Sie GPU-VMs, H4D-VMs oder TPUs reservieren möchten. Informationen zu den unterstützten Regionen und Zonen finden Sie unter Einschränkungen.

  • NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU- oder H4D-VMs. Bei GPU-VMs muss der Wert zwischen 1 und 80 liegen. Bei H4D-VMs muss der Wert zwischen 1 und 256 liegen.

  • MACHINE_TYPE: Der GPU- oder H4D-Maschinentyp, der reserviert werden soll. Geben Sie einen der folgenden Werte an:

    • Für A4-Maschinentypen: a4-highgpu-8g

    • Für A3 Ultra-Maschinentypen: a3-ultragpu-8g

    • Für A3 Mega-Maschinentypen: a3-megagpu-8g

    • Für A3-High-Maschinentypen mit 8 GPUs: a3-highgpu-8g

    • H4D-HPC-Maschinentypen: H4D-Maschinentypen

  • NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Der Wert muss 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024 sein.

  • TPU_VERSION: Die TPU-Version, die reserviert werden soll. Geben Sie einen der folgenden Werte an:

    • Für TPU7x: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X

    • Für TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Für TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Für TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Wenn Sie eine TPU v5e angeben, müssen Sie im Feld aggregateResources das Feld workloadType angeben. Legen Sie dieses Feld auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:

    • Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten (maschinelles Lernen), geben Sie BATCH an.

    • Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie SERVING an.

  • FROM_START_TIME und TO_START_TIME: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Ersetzen Sie Folgendes:

    • YYYY-MM-DD: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-) getrennt.

    • HH:MM:SS: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:) ist.

    • OFFSET: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie -08:00 an. Wenn Sie keinen Versatz verwenden möchten, geben Sie Z an.

  • FROM_END_TIME und TO_END_TIME: das früheste und das späteste Datum, an dem Ihre Kapazitätsreservierung enden soll. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel. Wenn Sie anstelle von Endzeiten einen Bereich von Zeiträumen für Ihren Reservierungszeitraum angeben möchten, ersetzen Sie die Felder endTimeNotEarlierThan und endTimeNotLaterThan durch die Felder minDuration und maxDuration.

Die Ausgabe sieht etwa so aus:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-central1-b": {
              "status": "RECOMMENDED",
              "details": "Recommendation in this zone is possible."
            },
            "zones/us-central1-c": {
              "status": "NO_CAPACITY",
              "details": "Temporarily no free capacity in this zone in the
                          requested time window."
            },
            "zones/us-central1-f": {
              "status": "NOT_SUPPORTED",
              "details": "This machine family is not supported in this zone."
            }
          },
          "location": "zones/us-central1-a"
        }
      }
    }
  ]
}

Wenn die angeforderten Ressourcen verfügbar sind, enthält die Ausgabe die Felder startTime, endTime und location. In diesen Feldern werden die früheste Startzeit, die späteste Endzeit und die Zonen angegeben, in denen Ressourcen verfügbar sind.

Reservierungsanfrage für GPU-VMs, H4D-VMs oder TPUs erstellen

Wenn Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus erstellen, können Sie den Reservierungszeitraum nur so angeben:

  • Startzeit: Je nach den Ressourcen, die Sie reservieren möchten, müssen Sie eine Startzeit angeben, die mindestens einen der folgenden Werte nach dem Zeitpunkt liegt, zu dem Sie eine Anfrage erstellen und einreichen:

    • Für GPU- und H4D-VMs: 87 Stunden (3 Tage und 15 Stunden)

    • Für TPUs: 6 Stunden

  • Ende: Sie können Ressourcen für maximal 90 Tage reservieren.

Wenn Sie eine Anfrage erstellen möchten, in der eine vorhandene GPU- oder H4D-VM als Referenz verwendet wird, verwenden Sie dieGoogle Cloud -Konsole. Wählen Sie andernfalls eine der folgenden Optionen aus:

Console

  1. Rufen Sie in der Google Cloud Console die Seite Reservierungen auf.

    Zu „Reservierungen“

  2. Klicken Sie auf den Tab Vorausschauende Reservierungen.

  3. Klicken Sie auf Vorausschauende Reservierung erstellen. Die Seite Zukünftige Reservierung erstellen wird angezeigt und der Bereich Hardwarekonfiguration ist ausgewählt.

  4. Geben Sie im Abschnitt Konfigurationen die Attribute der GPU-VMs, H4D-VMs oder TPUs an, die Sie reservieren möchten. Führen Sie dazu einen der folgenden Schritte aus:

    • So geben Sie GPU-VM-, H4D-VM- oder TPU-Attribute direkt an:

      1. Wählen Sie Maschinentyp angeben aus.

      2. Klicken Sie auf den Tab GPUs, TPUs oder Computing-optimiert und wählen Sie dann einen unterstützten GPU-Maschinentyp, H4D-Maschinentyp oder eine TPU-Version aus.

    • Wenn Sie GPU- oder H4D-VM-Attribute mithilfe einer vorhandenen VM als Referenz angeben möchten, wählen Sie Vorhandene VM verwenden und dann die VM aus.

  5. Wenn Sie im vorherigen Schritt eine TPU v5e (CT5LP) angegeben haben, wählen Sie in der Liste Arbeitslasttyp von TPU v5 eine der folgenden Optionen aus:

    • Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, wählen Sie Batch aus.

    • Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, wählen Sie Serving aus.

  6. Führen Sie im Bereich Nach Kapazität suchen die folgenden Schritte aus:

    1. Geben Sie in den Listen Region und Zone die Region und Zone an, in der Sie Ressourcen reservieren möchten.

    2. Geben Sie im Feld Benötigte Gesamtkapazität (beim Reservieren von GPU- oder H4D-VMs) oder in der Liste Anzahl der Chips (beim Reservieren von TPUs) die Anzahl der zu reservierenden GPU-VMs, H4D-VMs oder TPU-Chips an. Sie können die folgenden Werte angeben:

      • Bei GPU-VMs ein Wert zwischen 1 und 80
      • Für H4D-VMs ein Wert zwischen 1 und 256
      • Für TPU-Chips kann ein Wert von 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024 angegeben werden.
    3. Wählen Sie in der Liste Startzeit die Startzeit für Ihre Anfrage aus.

    4. Optional: Wählen Sie in der Liste Flexibilität für Startdatum auswählen aus, wie genau das Startdatum sein muss.

    5. Geben Sie im Feld Reservierungsdauer an, wie lange Sie Ressourcen reservieren möchten.

    6. Klicken Sie auf Nach Kapazität suchen. Wählen Sie dann in der Tabelle Verfügbare Kapazität eine der verfügbaren Optionen aus, die den Typ, die Anzahl und den Reservierungszeitraum der zu reservierenden GPU-VMs, H4D-VMs oder TPUs enthalten.

  7. Klicken Sie auf Weiter.

  8. Wählen Sie im Abschnitt Freigabetyp die Projekte aus, für die Sie die angeforderte Kapazität freigeben möchten:

    • Wenn Sie die reservierte Kapazität nur in Ihrem Projekt verwenden möchten, wählen Sie Lokal aus.

    • Wenn Sie die reservierte Kapazität für andere Projekte freigeben möchten, wählen Sie Freigegeben aus, klicken Sie auf  Projekte hinzufügen und folgen Sie der Anleitung, um die Projekte auszuwählen.

  9. Klicken Sie auf Weiter.

  10. Geben Sie im Feld Name der zukünftigen Reservierung einen Namen für die Anfrage ein.

  11. Geben Sie im Feld Name der Reservierung den Namen der Reservierung ein, die Compute Engine automatisch erstellt, um die angeforderte Kapazität bereitzustellen.

  12. Klicken Sie auf Erstellen.

gcloud

Verwenden Sie einen der folgenden gcloud beta compute future-reservations create-Befehle, um eine Anfrage für vorausschauende Reservierungen im Kalendermodus zu erstellen und zur Überprüfung einzureichen. Fügen Sie je nach den Ressourcen, die Sie reservieren möchten, die folgenden Flags ein:

  • Wenn Sie GPU- oder H4D-VMs reservieren möchten, fügen Sie die Flags --total-count, --machine-type und --deployment-type=DENSE ein:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --total-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    
  • Wenn Sie TPUs reservieren möchten, fügen Sie die Flags --chip-count und --tpu-version ein:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    

Ersetzen Sie Folgendes:

  • FUTURE_RESERVATION_NAME: der Name der Anfrage.

  • NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU- oder H4D-VMs. Bei GPU-VMs muss der Wert zwischen 1 und 80 liegen. Bei H4D-VMs muss der Wert zwischen 1 und 256 liegen. Geben Sie eine Anzahl von VMs an, die gleich oder niedriger ist als die Anzahl der VMs, die Sie als verfügbar bestätigt haben.

  • MACHINE_TYPE: Der GPU- oder H4D-Maschinentyp, der reserviert werden soll.

  • NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Geben Sie einen Wert an, der kleiner oder gleich der Anzahl der Chips ist, die Sie als verfügbar bestätigt haben. Der Wert muss einer der folgenden sein: 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024.

  • TPU_VERSION: Die TPU-Version, die reserviert werden soll. Wenn Sie eine TPU v5e (V5E) angeben, müssen Sie das --workload-type-Flag angeben, um den Typ der Arbeitslasten festzulegen, die auf den TPUs ausgeführt werden sollen.

  • RESERVATION_NAME: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.

  • SHARE_TYPE: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:

    • So verwenden Sie die Kapazität nur in Ihrem Projekt: local

    • So geben Sie Kapazität für andere Projekte frei: projects

    Wenn Sie projects angeben, müssen Sie das --share-with-Flag auf eine durch Kommas getrennte Liste von Projekt-IDs festlegen, z. B. project-1,project-2. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Die Projekt-ID darf nicht in dieser Liste enthalten sein. Sie können die reservierte Kapazität standardmäßig nutzen.

  • START_TIME: die Startzeit der Anfrage, die Sie als RFC 3339-Zeitstempel formatieren müssen.

  • END_TIME: das Ende des Reservierungszeitraums, das Sie als RFC 3339-Zeitstempel formatieren müssen. Wenn Sie anstelle einer Endzeit eine Dauer in Sekunden für den Reservierungszeitraum angeben möchten, ersetzen Sie das Flag --end-time durch das --duration-Flag.

  • ZONE: die Zone, in der Sie Ressourcen reservieren möchten.

REST

Wenn Sie eine Anfrage für vorausschauende Reservierungen im Kalendermodus erstellen und zur Überprüfung einreichen möchten, senden Sie die folgende POST-Anfrage an die Beta-Methode futureReservations.insert. Fügen Sie je nach den Ressourcen, die Sie reservieren möchten, die folgenden Felder in den Anfragetext ein:

  • Wenn Sie GPU- oder H4D-VMs reservieren möchten, fügen Sie die Felder totalCount und machineType sowie das Feld deploymentType mit dem Wert DENSE ein:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "totalCount": NUMBER_OF_VMS,
        "instanceProperties": {
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    
  • Wenn Sie TPUs reservieren möchten, geben Sie die Felder acceleratorCount und vmFamily an:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "aggregateReservation": {
        "reservedResources": [
          {
            "accelerator": {
              "acceleratorCount": NUMBER_OF_CHIPS
            }
          }
        ],
        "vmFamily": "TPU_VERSION"
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    

Ersetzen Sie Folgendes:

  • PROJECT_ID: die ID des Projekts, in dem Sie die Anfrage erstellen möchten.

  • ZONE: die Zone, in der Sie Ressourcen reservieren möchten.

  • FUTURE_RESERVATION_NAME: der Name der Anfrage.

  • RESERVATION_NAME: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.

  • SHARE_TYPE: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:

    • So verwenden Sie die Kapazität nur in Ihrem Projekt: LOCAL

    • So geben Sie Kapazität für andere Projekte frei: SPECIFIC_PROJECTS

    Wenn Sie SPECIFIC_PROJECTS angeben, müssen Sie im Feld shareSettings das Feld projectMap einfügen, um die Projekte anzugeben, für die die Kapazität freigegeben werden soll. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Geben Sie Ihre Projekt-ID nicht an. Sie können die reservierte Kapazität standardmäßig nutzen.

    Wenn Sie beispielsweise die angeforderte Kapazität für zwei weitere Projekte freigeben möchten, fügen Sie Folgendes ein:

    "shareSettings": {
      "shareType": "SPECIFIC_PROJECTS",
      "projectMap": {
        "CONSUMER_PROJECT_ID_1": {
          "projectId": "CONSUMER_PROJECT_ID_1"
        },
        "CONSUMER_PROJECT_ID_2": {
          "projectId": "CONSUMER_PROJECT_ID_2"
        }
      }
    }
    

    Ersetzen Sie CONSUMER_PROJECT_ID_1 und CONSUMER_PROJECT_ID_2 durch die IDs von zwei Projekten, die die angeforderte Kapazität nutzen dürfen.

  • NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU- oder H4D-VMs. Bei GPU-VMs muss der Wert zwischen 1 und 80 liegen. Bei H4D-VMs muss der Wert zwischen 1 und 256 liegen. Geben Sie eine Anzahl von VMs an, die gleich oder niedriger ist als die Anzahl der VMs, die Sie als verfügbar bestätigt haben.

  • MACHINE_TYPE: Der GPU- oder H4D-Maschinentyp, der reserviert werden soll.

  • NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Geben Sie einen Wert an, der kleiner oder gleich der Anzahl der Chips ist, die Sie als verfügbar bestätigt haben. Der Wert muss einer der folgenden sein: 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024.

  • TPU_VERSION: Die TPU-Version, die reserviert werden soll. Wenn Sie eine TPU v5e (VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP) angeben, müssen Sie im Feld aggregateResources das Feld workloadType einfügen, um den Typ der Arbeitslasten anzugeben, die auf den TPUs ausgeführt werden sollen.

  • START_TIME: die Startzeit der Anfrage, die Sie als RFC 3339-Zeitstempel formatieren müssen.

  • END_TIME: das Ende des Reservierungszeitraums, das Sie als RFC 3339-Zeitstempel formatieren müssen. Wenn Sie für Ihren Reservierungszeitraum anstelle einer Endzeit eine Dauer in Sekunden angeben möchten, ersetzen Sie das Feld endTime durch das Feld duration.

Nächste Schritte