Anfrage für vorausschauende Reservierungen im Kalendermodus erstellen

In diesem Dokument wird beschrieben, wie Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus erstellen, um GPU-, H4D- oder TPU-Ressourcen für Ihre VM-Instanzen zu reservieren. Mit diesen Anfragen können Sie stark nachgefragte Ressourcen zum Erstellen von VMs erhalten, die Sie bis zu 90 Tage lang ausführen möchten.

Sie können Anfragen für vorausschauende Reservierungen im Kalendermodus verwenden, um Ressourcen für die Ausführung der folgenden Arbeitslasten zu reservieren:

Jobs zum Vortrainieren von Modellen
Jobs zur Modellabstimmung
Arbeitslasten für HPC-Simulationen (High Performance Computing)
Kurzfristige Steigerungen der Inferenzarbeitslasten

Nachdem Google Cloud Ihre Anfrage genehmigt hat, stehen Ihnen die reservierten Ressourcen zur Verfügung, um GPU-, H4D- oder TPU-VMs am angegebenen Lieferdatum und zur angegebenen Lieferzeit zu erstellen. Während des Reservierungszeitraums haben nur Ihr Projekt und alle Projekte, die Sie beim Erstellen der Anfrage angeben, Zugriff auf die reservierten Ressourcen. Sie können die reservierten Ressourcen für bis zu 100 Projekte freigeben, die sich in derselben Organisation wie Ihr Projekt befinden. Weitere Informationen zu den Anforderungen und Einschränkungen, die Sie beim Erstellen einer Anfrage im Kalendermodus anwenden, finden Sie unter Anfragen für vorausschauende Reservierungen im Kalendermodus – Übersicht.

Hinweise

Wenn Sie keine Anfragen für vorausschauende Reservierungen im Kalendermodus verwenden können, haben Sie möglicherweise keinen Zugriff auf diese Funktion. Wenden Sie sich in diesem Fall an Ihr Kontoteam oder das Vertriebsteam.
Wenn Sie Ihre reservierte Kapazität für andere Projekte in Ihrer Organisation freigeben möchten, prüfen Sie, ob das Projekt, in dem Sie vorausschauende Reservierungsanfragen im Kalendermodus erstellen möchten, freigegebene Reservierungen erstellen darf. Andernfalls treten Fehler auf.
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei der Compute Engine authentifizieren:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
  gcloud init
  Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
  
  Hinweis: Wenn Sie die gcloud CLI zuvor installiert haben, prüfen Sie, ob Sie die aktuelle Version haben, indem Sie gcloud components update ausführen.
2. Set a default region and zone.
REST

Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.
Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen für das Projekt die IAM-Rolle Compute Future Reservation User (roles/compute.futureReservationUser) zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen einer zukünftigen Reservierungsanfrage im Kalendermodus benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen einer Anfrage für vorausschauende Reservierung im Kalendermodus erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um eine Anfrage für vorausschauende Reservierung im Kalendermodus zu erstellen:

So erstellen Sie eine zukünftige Reservierungsanfrage: compute.futureReservations.create für das Projekt
So werden von Compute Engine Reservierungen automatisch erstellt: compute.reservations.create für das Projekt
So sehen Sie die Verfügbarkeit von Ressourcen an einem zukünftigen Datum: compute.advice.calendarMode im Projekt

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Anfrage für vorausschauende Reservierung im Kalendermodus erstellen

So erstellen Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus:

Zukünftige Verfügbarkeit von Ressourcen ansehen Sehen Sie sich die zukünftige Verfügbarkeit der GPU-VMs, H4D-VMs oder TPUs an, die Sie reservieren möchten. Geben Sie dann beim Erstellen einer Anfrage die Anzahl, den Typ und die Reservierungsdauer der Ressourcen an, die Sie als verfügbar bestätigt haben. Google Cloud wird Ihre Anfrage mit größerer Wahrscheinlichkeit genehmigen, wenn Sie diese Informationen angeben.

Hinweis: Wenn Sie eine Anfrage über die Google Cloud Konsole erstellen, überspringen Sie diesen Schritt. Sie können die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs während der Erstellung der Anfrage einsehen.

Eine Anleitung finden Sie unter Zukünftige Verfügbarkeit von Ressourcen ansehen.
Reservierungsanfrage erstellen Erstellen und senden Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus für GPU-VMs, H4D-VMs oder TPUs. Wenn Sie eine Anfrage erfolgreich erstellen können, genehmigt Google Cloud sie innerhalb einer Minute.

Eine Anleitung finden Sie unter Anfrage für GPU-VMs, H4D-VMs oder TPUs erstellen.

Zukünftige Verfügbarkeit von Ressourcen ansehen

So rufen Sie die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region auf:

Für GPU- oder H4D-VMs: bis zu 60 Tage im Voraus
Für TPUs bis zu 120 Tage im Voraus

Wählen Sie eine der folgenden Optionen aus, um die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region aufzurufen:

Console

Sie können die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region einsehen, wenn Sie im Kalendermodus eine Anfrage für eine vorausschauende Reservierung erstellen. Weitere Informationen finden Sie in diesem Dokument unter Anfrage für GPU-VMs, H4D-VMs oder TPUs erstellen.

gcloud

Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region aufrufen möchten, verwenden Sie den gcloud compute advice calendar-mode-Befehl. Fügen Sie je nach den Ressourcen, die Sie aufrufen möchten, die folgenden Flags ein:

Wenn Sie die Verfügbarkeit von GPU-VMs oder H4D-VMs aufrufen möchten, fügen Sie die Flags --vm-count und --machine-type ein:

gcloud compute advice calendar-mode \
    --vm-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Wenn Sie die TPU-Verfügbarkeit aufrufen möchten, fügen Sie die Flags --chip-count und --tpu-version ein:

gcloud compute advice calendar-mode \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Ersetzen Sie Folgendes:

NUMBER_OF_VMS: die Anzahl der zu reservierenden VMs. Der Wert muss für GPU-VMs mindestens 1 und maximal 80 und für H4D-VMs maximal 256 betragen.
MACHINE_TYPE: Der GPU- oder H4D-Maschinentyp, der reserviert werden soll. Geben Sie einen der folgenden Werte an:
- Für A4-Maschinentypen: a4-highgpu-8g
- Für A3 Ultra-Maschinentypen: a3-ultragpu-8g
- Für A3 Mega-Maschinentypen: a3-megagpu-8g
- Für A3-High-Maschinentypen mit 8 GPUs: a3-highgpu-8g
- H4D-HPC-Maschinentypen: H4D-Maschinentypen
NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Der Wert muss 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024 sein.
TPU_VERSION: Die TPU-Version, die reserviert werden soll. Geben Sie einen der folgenden Werte an:
- Für TPU7x: TPU7X
- Für TPU v6e: V6E
- Für TPU v5p: V5P
- Für TPU v5e: V5E
Wenn Sie eine TPU v5e angeben, müssen Sie das Flag --workload-type angeben. Legen Sie dieses Flag auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:
- Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten (maschinelles Lernen), geben Sie BATCH an.
- Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie SERVING an.
  
  Hinweis :Wenn Sie SERVING angeben, können Sie nur 1, 4 oder 8 TPU v5e-Chips reservieren.
REGION: die Region, in der GPU-VMs, H4D-VMs oder TPUs reserviert werden sollen. Informationen dazu, welche Regionen und Zonen unterstützt werden, finden Sie unter Einschränkungen.
FROM_START_TIME und TO_START_TIME: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Ersetzen Sie Folgendes:
- YYYY-MM-DD: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-) getrennt.
- HH:MM:SS: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:) ist.
- OFFSET: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie -08:00 an. Wenn Sie keinen Versatz verwenden möchten, geben Sie Z an.
MIN_DURATION und MAX_DURATION: die minimale und maximale Zeitspanne, für die Sie Ressourcen reservieren möchten. Sie müssen diese Werte als Anzahl von Tagen, Stunden, Minuten oder Sekunden gefolgt von d, h, m bzw. s formatieren. Geben Sie beispielsweise 24h für 24 Stunden oder 1d2h3m4s für einen Tag, zwei Stunden, drei Minuten und vier Sekunden an.

Die Ausgabe sieht etwa so aus:

- recommendationsPerSpec:
    spec:
      endTime: '2026-02-10T00:00:00Z'
      location: zones/us-central1-a
      otherLocations:
        zones/us-central1-b:
          details: Recommendation in this zone is possible.
          status: RECOMMENDED
        zones/us-central1-c:
          details: Temporarily no free capacity in this zone in the
          requested time window.
          status: NO_CAPACITY
        zones/us-central1-f:
          details: This machine family is not supported in this zone.
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2026-02-07T00:00:00Z'

Wenn die angeforderten Ressourcen verfügbar sind, enthält die Ausgabe die Felder startTime, endTime und location. In diesen Feldern werden die früheste Startzeit, die späteste Endzeit und die Zonen angegeben, in denen Ressourcen verfügbar sind.

REST

Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs, H4D-VMs oder TPUs in einer Region aufrufen möchten, stellen Sie eine GET-Anfrage an die advice.calendarMode-Methode. Fügen Sie basierend auf den Ressourcen, die Sie aufrufen möchten, die folgenden Felder in den Anfragetext ein:

Wenn Sie die Verfügbarkeit von GPU-VMs oder H4D-VMs aufrufen möchten, fügen Sie die Felder instanceCount und machineType ein:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "specificSkuResources": {
          "instanceCount": "NUMBER_OF_VMS",
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Wenn Sie die TPU-Verfügbarkeit sehen möchten, fügen Sie die Felder acceleratorCount und vmFamily ein:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "aggregateResources": {
          "acceleratorCount": "NUMBER_OF_CHIPS",
          "vmFamily": "TPU_VERSION"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Ersetzen Sie Folgendes:

PROJECT_ID: die ID des Projekts, in dem Sie Ressourcen reservieren möchten.
REGION: die Region, in der Sie GPU-VMs, H4D-VMs oder TPUs reservieren möchten. Informationen zu den unterstützten Regionen und Zonen finden Sie unter Einschränkungen.
NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU- oder H4D-VMs. Bei GPU-VMs muss der Wert zwischen 1 und 80 liegen. Bei H4D-VMs muss der Wert zwischen 1 und 256 liegen.
MACHINE_TYPE: Der GPU- oder H4D-Maschinentyp, der reserviert werden soll. Geben Sie einen der folgenden Werte an:
- Für A4-Maschinentypen: a4-highgpu-8g
- Für A3 Ultra-Maschinentypen: a3-ultragpu-8g
- Für A3 Mega-Maschinentypen: a3-megagpu-8g
- Für A3-High-Maschinentypen mit 8 GPUs: a3-highgpu-8g
- H4D-HPC-Maschinentypen: H4D-Maschinentypen
NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Der Wert muss 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024 sein.
TPU_VERSION: Die TPU-Version, die reserviert werden soll. Geben Sie einen der folgenden Werte an:
- Für TPU7x: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
- Für TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- Für TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
- Für TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Wenn Sie eine TPU v5e angeben, müssen Sie im Feld aggregateResources das Feld workloadType angeben. Legen Sie dieses Feld auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:
- Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten (maschinelles Lernen), geben Sie BATCH an.
- Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie SERVING an.
  
  Hinweis :Wenn Sie SERVING angeben, können Sie nur 1, 4 oder 8 TPU v5e-Chips reservieren.
FROM_START_TIME und TO_START_TIME: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Ersetzen Sie Folgendes:
- YYYY-MM-DD: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-) getrennt.
- HH:MM:SS: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:) ist.
- OFFSET: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie -08:00 an. Wenn Sie keinen Versatz verwenden möchten, geben Sie Z an.
MIN_DURATION und MAX_DURATION: die minimale und maximale Zeit in Sekunden, für die Sie Ressourcen reservieren möchten. Sie müssen diese Werte als Anzahl von Sekunden gefolgt von s formatieren. Geben Sie beispielsweise 86400s für 86.400 Sekunden (24 Stunden) an.

Die Ausgabe sieht etwa so aus:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2026-02-07T00:00:00Z",
          "endTime": "2026-02-10T00:00:00Z",
          "otherLocations": {
            "zones/us-central1-b": {
              "status": "RECOMMENDED",
              "details": "Recommendation in this zone is possible."
            },
            "zones/us-central1-c": {
              "status": "NO_CAPACITY",
              "details": "Temporarily no free capacity in this zone in the
                          requested time window."
            },
            "zones/us-central1-f": {
              "status": "NOT_SUPPORTED",
              "details": "This machine family is not supported in this zone."
            }
          },
          "location": "zones/us-central1-a"
        }
      }
    }
  ]
}

Anfrage für GPU-VMs, H4D-VMs oder TPUs erstellen

Wenn Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus erstellen, können Sie den Reservierungszeitraum nur so angeben:

Startzeit: Je nach den Ressourcen, die Sie reservieren möchten, müssen Sie eine Startzeit angeben, die mindestens einen der folgenden Werte nach dem Zeitpunkt liegt, zu dem Sie eine Anfrage erstellen und einreichen:
- Für GPU- und H4D-VMs: 87 Stunden (3 Tage und 15 Stunden)
- Für TPUs: 6 Stunden
Dauer: Sie können Ressourcen für mindestens 24 Stunden und maximal 90 Tage reservieren.

Wenn Sie eine Anfrage erstellen möchten, in der eine vorhandene GPU- oder H4D-VM als Referenz verwendet wird, verwenden Sie dieGoogle Cloud -Konsole. Wählen Sie andernfalls eine der folgenden Optionen aus:

Console

Rufen Sie in der Google Cloud Console die Seite Reservierungen auf.

Zu „Reservierungen“
Klicken Sie auf den Tab Vorausschauende Reservierungen.
Klicken Sie auf Vorausschauende Reservierung erstellen. Die Seite Zukünftige Reservierung erstellen wird angezeigt und der Bereich Hardwarekonfiguration ist ausgewählt.
Geben Sie im Abschnitt Konfigurationen die Attribute der GPU-VMs, H4D-VMs oder TPUs an, die Sie reservieren möchten. Führen Sie dazu einen der folgenden Schritte aus:
- So geben Sie GPU-VM-, H4D-VM- oder TPU-Attribute direkt an:
  1. Wählen Sie Maschinentyp angeben aus.
  2. Klicken Sie auf den Tab GPUs, TPUs oder Computing-optimiert und wählen Sie dann einen unterstützten GPU-Maschinentyp, H4D-Maschinentyp oder eine TPU-Version aus.
- Wenn Sie GPU- oder H4D-VM-Attribute mithilfe einer vorhandenen VM als Referenz angeben möchten, wählen Sie Vorhandene VM verwenden und dann die VM aus.
Wenn Sie im vorherigen Schritt eine TPU v5e (CT5LP) angegeben haben, wählen Sie in der Liste Arbeitslasttyp von TPU v5 eine der folgenden Optionen aus:
- Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, wählen Sie Batch aus.
- Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, wählen Sie Serving aus.
  
  Hinweis :Wenn Sie Serving auswählen, können Sie nur 1, 4 oder 8 TPU v5e-Chips reservieren.
Führen Sie im Bereich Nach Kapazität suchen die folgenden Schritte aus:
1. Wählen Sie in den Listen Region und Zone die Region und Zone aus, in der Sie Ressourcen reservieren möchten.
2. Geben Sie im Feld Benötigte Gesamtkapazität (beim Reservieren von GPU- oder H4D-VMs) oder in der Liste Anzahl der Chips (beim Reservieren von TPUs) die Anzahl der zu reservierenden GPU-VMs, H4D-VMs oder TPU-Chips an. Sie können die folgenden Werte angeben:
  - Bei GPU-VMs ein Wert zwischen 1 und 80
  - Für H4D-VMs ein Wert zwischen 1 und 256
  - Für TPU-Chips kann ein Wert von 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024 angegeben werden.
3. Wählen Sie in der Liste Startzeit die Startzeit für Ihre Anfrage aus.
4. Optional: Wählen Sie in der Liste Flexibilität für Startdatum auswählen aus, wie genau das Startdatum sein muss.
5. Geben Sie im Feld Reservierungsdauer an, wie lange Sie Ressourcen reservieren möchten.
6. Klicken Sie auf Nach Kapazität suchen. Wählen Sie dann in der Tabelle Verfügbare Kapazität eine der verfügbaren Optionen aus, die den Typ, die Anzahl und den Reservierungszeitraum der zu reservierenden GPU-VMs, H4D-VMs oder TPUs enthalten.
Klicken Sie auf Weiter.
Wählen Sie im Abschnitt Freigabetyp die Projekte aus, für die Sie die angeforderte Kapazität freigeben möchten:
- Wenn Sie die reservierte Kapazität nur in Ihrem Projekt verwenden möchten, wählen Sie Lokal aus.
- Wenn Sie die reservierte Kapazität für andere Projekte freigeben möchten, wählen Sie Freigegeben aus, klicken Sie auf Projekte hinzufügen und folgen Sie der Anleitung, um die Projekte auszuwählen.
Wichtig :Sie können den Freigabetyp und die freigegebenen Projekte nur beim Erstellen einer Anfrage angeben. Diese Einstellungen können nach dem Einreichen nicht mehr geändert werden.
Klicken Sie auf Weiter.
Geben Sie im Feld Name der zukünftigen Reservierung einen Namen für die Anfrage ein.
Geben Sie im Feld Name der Reservierung den Namen der Reservierung ein, die Compute Engine automatisch erstellt, um die angeforderte Kapazität bereitzustellen.
Klicken Sie auf Erstellen.

gcloud

Verwenden Sie den Befehl gcloud compute future-reservations create, um eine zukünftige Reservierungsanfrage im Kalendermodus zu erstellen und zur Überprüfung einzureichen. Fügen Sie je nach den Ressourcen, die Sie reservieren möchten, die folgenden Flags ein:

Wenn Sie GPU- oder H4D-VMs reservieren möchten, fügen Sie die Flags --total-count, --machine-type und --deployment-type=DENSE ein:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --total-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Wenn Sie TPUs reservieren möchten, fügen Sie die Flags --chip-count und --tpu-version ein:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Ersetzen Sie Folgendes:

FUTURE_RESERVATION_NAME: der Name der Anfrage.
NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU- oder H4D-VMs:
- Bei GPU-VMs muss der Wert zwischen 1 und 80 liegen.
- Bei H4D-VMs muss der Wert zwischen 1 und 256 liegen.
Geben Sie eine Anzahl von VMs an, die gleich oder niedriger ist als die Anzahl der VMs, die Sie als verfügbar bestätigt haben.
MACHINE_TYPE: Der GPU- oder H4D-Maschinentyp, der reserviert werden soll.
NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Geben Sie einen Wert an, der kleiner oder gleich der Anzahl der Chips ist, die Sie als verfügbar bestätigt haben. Der Wert muss einer der folgenden sein: 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024.
TPU_VERSION: Die TPU-Version, die reserviert werden soll. Wenn Sie eine TPU v5e (V5E) angeben, müssen Sie das Flag --workload-type angeben, um den Typ der Arbeitslasten festzulegen, die auf den TPUs ausgeführt werden sollen.
RESERVATION_NAME: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.
SHARE_TYPE: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:
- So verwenden Sie die Kapazität nur in Ihrem Projekt: local
- So geben Sie Kapazität für andere Projekte frei: projects
Wenn Sie projects angeben, müssen Sie das --share-with-Flag auf eine durch Kommas getrennte Liste von Projekt-IDs festlegen, z. B. project-1,project-2. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Die Projekt-ID darf nicht in dieser Liste enthalten sein. Sie können die reservierte Kapazität standardmäßig nutzen.

Wichtig :Sie können den Freigabetyp und die freigegebenen Projekte nur beim Erstellen einer Anfrage angeben. Diese Einstellungen können nach dem Einreichen nicht mehr geändert werden.
START_TIME: die Startzeit der Anfrage, die Sie als RFC 3339-Zeitstempel formatieren müssen.
END_TIME: das Ende des Reservierungszeitraums, das Sie als RFC 3339-Zeitstempel formatieren müssen. Wenn Sie anstelle einer Endzeit eine Dauer in Sekunden für den Reservierungszeitraum angeben möchten, ersetzen Sie das Flag --end-time durch das --duration-Flag.
ZONE: die Zone, in der Sie Ressourcen reservieren möchten.

REST

Wenn Sie eine zukünftige Reservierungsanfrage im Kalendermodus erstellen und zur Überprüfung einreichen möchten, stellen Sie eine POST-Anfrage an die Methode futureReservations.insert. Fügen Sie basierend auf den Ressourcen, die Sie reservieren möchten, die folgenden Felder in den Anfragetext ein:

Wenn Sie GPU- oder H4D-VMs reservieren möchten, fügen Sie die Felder totalCount und machineType sowie das Feld deploymentType mit dem Wert DENSE ein:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "specificSkuProperties": {
    "totalCount": NUMBER_OF_VMS,
    "instanceProperties": {
      "machineType": "MACHINE_TYPE"
    }
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Wenn Sie TPUs reservieren möchten, geben Sie die Felder acceleratorCount und vmFamily an:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "aggregateReservation": {
    "reservedResources": [
      {
        "accelerator": {
          "acceleratorCount": NUMBER_OF_CHIPS
        }
      }
    ],
    "vmFamily": "TPU_VERSION"
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Ersetzen Sie Folgendes:

PROJECT_ID: die ID des Projekts, in dem Sie die Anfrage erstellen möchten.
ZONE: die Zone, in der Sie Ressourcen reservieren möchten.
FUTURE_RESERVATION_NAME: der Name der Anfrage.
RESERVATION_NAME: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.
SHARE_TYPE: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:
- So verwenden Sie die Kapazität nur in Ihrem Projekt: LOCAL
- So geben Sie Kapazität für andere Projekte frei: SPECIFIC_PROJECTS
Wenn Sie SPECIFIC_PROJECTS angeben, müssen Sie im Feld shareSettings das Feld projectMap einfügen, um die Projekte anzugeben, für die die Kapazität freigegeben werden soll. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Geben Sie Ihre Projekt-ID nicht an. Sie können die reservierte Kapazität standardmäßig nutzen.

Wichtig :Sie können den Freigabetyp und die freigegebenen Projekte nur beim Erstellen einer Anfrage angeben. Diese Einstellungen können nach dem Einreichen nicht mehr geändert werden.

Wenn Sie beispielsweise die angeforderte Kapazität für zwei weitere Projekte freigeben möchten, fügen Sie Folgendes ein:
```
"shareSettings": {
  "shareType": "SPECIFIC_PROJECTS",
  "projectMap": {
    "CONSUMER_PROJECT_ID_1": {
      "projectId": "CONSUMER_PROJECT_ID_1"
    },
    "CONSUMER_PROJECT_ID_2": {
      "projectId": "CONSUMER_PROJECT_ID_2"
    }
  }
}
```
Ersetzen Sie CONSUMER_PROJECT_ID_1 und CONSUMER_PROJECT_ID_2 durch die IDs von zwei Projekten, die die angeforderte Kapazität nutzen dürfen.
NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU- oder H4D-VMs:
- Bei GPU-VMs muss der Wert zwischen 1 und 80 liegen.
- Bei H4D-VMs muss der Wert zwischen 1 und 256 liegen.
Geben Sie eine Anzahl von VMs an, die gleich oder niedriger ist als die Anzahl der VMs, die Sie als verfügbar bestätigt haben.
MACHINE_TYPE: Der GPU- oder H4D-Maschinentyp, der reserviert werden soll.
NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Geben Sie einen Wert an, der kleiner oder gleich der Anzahl der Chips ist, die Sie als verfügbar bestätigt haben. Der Wert muss einer der folgenden sein: 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1024.
TPU_VERSION: Die TPU-Version, die reserviert werden soll. Wenn Sie eine TPU v5e (VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP) angeben, müssen Sie im Feld aggregateResources das Feld workloadType einfügen, um den Typ der Arbeitslasten anzugeben, die auf den TPUs ausgeführt werden sollen.
START_TIME: die Startzeit der Anfrage, die Sie als RFC 3339-Zeitstempel formatieren müssen.
END_TIME: das Ende des Reservierungszeitraums, das Sie als RFC 3339-Zeitstempel formatieren müssen. Wenn Sie für Ihren Reservierungszeitraum anstelle einer Endzeit eine Dauer in Sekunden angeben möchten, ersetzen Sie das Feld endTime durch das Feld duration.

Nächste Schritte

So nutzen Sie eine automatisch erstellte Reservierung in Compute Engine für GPU- oder H4D-VMs:
Automatisch erstellte Reservierung für GPU-VMs oder TPUs in Vertex AI nutzen:
- Reservierungen mit Online-Inferenzjobs verwenden
- Reservierungen mit Trainingsjobs verwenden
Automatisch erstellte Reservierung für TPUs in Cloud TPU nutzen
Reservierungen oder Anfragen für vorausschauende Reservierungen ansehen

Anfrage für vorausschauende Reservierungen im Kalendermodus erstellen Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Hinweise

Console

gcloud

REST

Erforderliche Rollen

Erforderliche Berechtigungen

Anfrage für vorausschauende Reservierung im Kalendermodus erstellen

Zukünftige Verfügbarkeit von Ressourcen ansehen

Console

gcloud

REST

Anfrage für GPU-VMs, H4D-VMs oder TPUs erstellen

Console

gcloud

REST

Nächste Schritte

Anfrage für vorausschauende Reservierungen im Kalendermodus erstellen