In diesem Dokument wird erläutert, wie Sie eine Anfrage für vorausschauende Reservierungen im Kalendermodus erstellen. Mit diesen Anfragen können Sie Ressourcen mit hoher Nachfrage reservieren, um VM-Instanzen mit angehängten GPUs oder TPUs zu erstellen, die bis zu 90 Tage lang ausgeführt werden.
Sie können Anfragen für vorausschauende Reservierungen im Kalendermodus verwenden, um Ressourcen mit hoher Nachfrage für die Ausführung der folgenden Arbeitslasten zu reservieren:
Jobs zum Vortrainieren von Modellen
Jobs zur Modellabstimmung
Arbeitslasten für HPC-Simulationen (High Performance Computing)
Kurzfristige Steigerungen bei Inferenzarbeitslasten
Nachdem Google Cloud eine Anfrage im Kalendermodus genehmigt hat, stehen Ihnen die reservierten Ressourcen zur Verfügung, um GPU- oder TPU-VMs zum angegebenen Lieferdatum und zur angegebenen Lieferzeit zu erstellen. Weitere Informationen zu den Anforderungen und Einschränkungen, die Sie beim Erstellen einer Anfrage im Kalendermodus anwenden, finden Sie unter Anfragen für vorausschauende Reservierungen im Kalendermodus – Übersicht.
Hinweise
- Wenn Sie keine Anfragen für vorausschauende Reservierungen im Kalendermodus verwenden können, haben Sie möglicherweise keinen Zugriff auf diese Funktion. Wenden Sie sich in diesem Fall an Ihr Kontoteam oder das Vertriebsteam.
- Wenn Sie Ihre reservierte Kapazität für andere Projekte in Ihrer Organisation freigeben möchten, muss das Projekt, in dem Sie Anfragen für vorausschauende Reservierungen im Kalendermodus erstellen möchten, für die Erstellung freigegebener Reservierungen zugelassen sein. Andernfalls treten Fehler auf.
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
gcloud initWenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
- Set a default region and zone.
REST
Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.
Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
gcloud initWenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute Future Reservation User (
roles/compute.futureReservationUser) für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen einer zukünftigen Reservierungsanfrage im Kalendermodus benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen einer Anfrage für vorausschauende Reservierung im Kalendermodus erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um eine Anfrage für vorausschauende Reservierung im Kalendermodus zu erstellen:
-
So erstellen Sie eine zukünftige Reservierungsanfrage:
compute.futureReservations.createfür das Projekt -
So werden von Compute Engine Reservierungen automatisch erstellt:
compute.reservations.createfür das Projekt -
So geben Sie eine Instanzvorlage an:
compute.instanceTemplates.useReadOnlyfür die Instanzvorlage -
So sehen Sie die zukünftige Verfügbarkeit von Ressourcen:
compute.advice.calendarModeim Projekt
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Übersicht
So erstellen Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus:
Zukünftige Verfügbarkeit von Ressourcen ansehen Sehen Sie sich die zukünftige Verfügbarkeit der GPU-VMs oder TPUs an, die Sie reservieren möchten. Geben Sie dann beim Erstellen einer Anfrage die Anzahl, den Typ und die Reservierungsdauer der Ressourcen an, die Sie als verfügbar bestätigt haben. Google Cloud genehmigt Ihre Anfrage mit größerer Wahrscheinlichkeit, wenn Sie diese Informationen angeben.
Reservierungsanfrage für GPU-VMs oder TPUs erstellen Erstellen und senden Sie eine Anfrage für vorausschauende Reservierung im Kalendermodus für GPU-VMs oder TPUs. Wenn Sie eine Anfrage erfolgreich erstellen können, genehmigt Google Cloud sie innerhalb einer Minute.
Zukünftige Verfügbarkeit von Ressourcen ansehen
So rufen Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region auf:
Für GPU-VMs bis zu 60 Tage im Voraus
Für TPUs bis zu 120 Tage im Voraus
Wählen Sie eine der folgenden Optionen aus, um die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region aufzurufen:
Console
Wenn Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus erstellen, können Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region ansehen. Weitere Informationen finden Sie in diesem Dokument unter Reservierungsanfrage für GPU-VMs oder TPUs erstellen.
gcloud
Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region aufrufen möchten, verwenden Sie einen der folgenden
gcloud beta compute advice calendar-mode-Befehle. Fügen Sie je nach den Ressourcen, die Sie aufrufen möchten, die folgenden Flags ein:Wenn Sie die Verfügbarkeit von GPU-VMs aufrufen möchten, fügen Sie die Flags
--vm-countund--machine-typeein:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIMEWenn Sie die TPU-Verfügbarkeit aufrufen möchten, fügen Sie die Flags
--chip-countund--tpu-versionein:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Ersetzen Sie Folgendes:
NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU-VMs. Der Wert muss zwischen1und80liegen.MACHINE_TYPE: Der GPU-Maschinentyp, der reserviert werden soll. Geben Sie einen der folgenden Werte an:Für A4-Maschinentypen:
a4-highgpu-8gFür A3 Ultra-Maschinentypen:
a3-ultragpu-8g
NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Der Wert muss1,4,8,16,32,64,128,256,512oder1024sein.TPU_VERSION: Die TPU-Version, die reserviert werden soll. Geben Sie einen der folgenden Werte an:Für TPU v6e:
V6EFür TPU v5p:
V5PFür TPU v5e:
V5E
Wenn Sie eine TPU v5e angeben, müssen Sie das Flag
--workload-typeangeben. Legen Sie dieses Flag auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten (maschinelles Lernen), geben Sie
BATCHan.Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie
SERVINGan.
REGION: die Region, in der GPU-VMs oder TPUs reserviert werden sollen. Informationen dazu, welche Regionen und Zonen unterstützt werden, finden Sie unter Einschränkungen.FROM_START_TIMEundTO_START_TIME: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:YYYY-MM-DDTHH:MM:SSOFFSETErsetzen Sie Folgendes:
YYYY-MM-DD: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-) getrennt.HH:MM:SS: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:) ist.OFFSET: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie-08:00an. Wenn Sie keinen Versatz verwenden möchten, geben SieZan.
FROM_END_TIMEundTO_END_TIME: das früheste und das späteste Datum, an dem Ihre Kapazitätsreservierung enden soll. Formatieren Sie diese Daten als RFC 3339-Zeitstempel. Wenn Sie anstelle von Endzeiten einen Bereich von Dauern für den Reservierungszeitraum angeben möchten, ersetzen Sie das Flag--end-time-rangedurch das--duration-range-Flag.
Die Ausgabe sieht etwa so aus:
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-east5-a otherLocations: zones/us-east5-b: details: this machine family is not supported in this zone status: NOT_SUPPORTED zones/us-east5-c: details: this machine family is not supported in this zone status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'Wenn die angeforderten Ressourcen verfügbar sind, enthält die Ausgabe die Felder
startTime,endTimeundlocation. In diesen Feldern werden die früheste Startzeit, die späteste Endzeit und die Zonen angegeben, in denen Ressourcen verfügbar sind.REST
Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region aufrufen möchten, senden Sie eine
GET-Anfrage an die Betaversion der Methodeadvice.calendarMode. Fügen Sie je nach den Ressourcen, die Sie aufrufen möchten, die folgenden Felder in den Anfragetext ein:Wenn Sie die Verfügbarkeit von GPU-VMs aufrufen möchten, fügen Sie die Felder
instanceCountundmachineTypeein:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }Wenn Sie die TPU-Verfügbarkeit sehen möchten, fügen Sie die Felder
acceleratorCountundvmFamilyein:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Ersetzen Sie Folgendes:
PROJECT_ID: die ID des Projekts, in dem Sie Ressourcen reservieren möchten.REGION: die Region, in der Sie GPU-VMs oder TPUs reservieren möchten. Informationen zu den unterstützten Regionen und Zonen finden Sie unter Einschränkungen.NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU-VMs. Der Wert muss zwischen1und80liegen.MACHINE_TYPE: Der GPU-Maschinentyp, der reserviert werden soll. Geben Sie einen der folgenden Werte an:Für A4-Maschinentypen:
a4-highgpu-8gFür A3 Ultra-Maschinentypen:
a3-ultragpu-8g
NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Der Wert muss1,4,8,16,32,64,128,256,512oder1024sein.TPU_VERSION: Die TPU-Version, die reserviert werden soll. Geben Sie einen der folgenden Werte an:Für TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6EFür TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PFür TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Wenn Sie eine TPU v5e angeben, müssen Sie im Feld
aggregateResourcesdas FeldworkloadTypeangeben. Legen Sie dieses Feld auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten (maschinelles Lernen), geben Sie
BATCHan.Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie
SERVINGan.
FROM_START_TIMEundTO_START_TIME: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:YYYY-MM-DDTHH:MM:SSOFFSETErsetzen Sie Folgendes:
YYYY-MM-DD: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-) getrennt.HH:MM:SS: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:) ist.OFFSET: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie-08:00an. Wenn Sie keinen Versatz verwenden möchten, geben SieZan.
FROM_END_TIMEundTO_END_TIME: das früheste und das späteste Datum, an dem Ihre Kapazitätsreservierung enden soll. Formatieren Sie diese Daten als RFC 3339-Zeitstempel. Wenn Sie anstelle von Endzeiten einen Bereich von Zeiträumen für Ihren Reservierungszeitraum angeben möchten, ersetzen Sie die FelderendTimeNotEarlierThanundendTimeNotLaterThandurch die FelderminDurationundmaxDuration.
Die Ausgabe sieht etwa so aus:
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-east5-b": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" }, "zones/us-east5-c": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" } }, "location": "zones/us-east5-a" } } } ] }Wenn die angeforderten Ressourcen verfügbar sind, enthält die Ausgabe die Felder
startTime,endTimeundlocation. In diesen Feldern werden die früheste Startzeit, die späteste Endzeit und die Zonen angegeben, in denen Ressourcen verfügbar sind.Reservierungsanfrage für GPU-VMs oder TPUs erstellen
Wenn Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus erstellen, können Sie den Reservierungszeitraum nur so angeben:
Startzeit: Je nach den Ressourcen, die Sie reservieren möchten, müssen Sie eine Startzeit angeben, die mindestens einen der folgenden Werte nach dem Zeitpunkt liegt, zu dem Sie eine Anfrage erstellen und einreichen:
Für GPU-VMs: 87 Stunden (3 Tage und 15 Stunden)
Für TPUs: sechs Stunden
Ende: Sie können Ressourcen für maximal 90 Tage reservieren.
Wenn Sie eine Anfrage erstellen möchten, indem Sie eine vorhandene GPU-VM als Referenz verwenden, nutzen Sie dieGoogle Cloud Console. Wählen Sie andernfalls eine der folgenden Optionen aus:
Console
Rufen Sie in der Google Cloud Console die Seite Reservierungen auf.
Klicken Sie auf den Tab Vorausschauende Reservierungen.
Klicken Sie auf Vorausschauende Reservierung erstellen. Die Seite Zukünftige Reservierung erstellen wird angezeigt und der Bereich Hardwarekonfiguration ist ausgewählt.
Geben Sie im Abschnitt Konfiguration die Attribute der GPU-VMs oder TPUs an, die Sie reservieren möchten. Gehen Sie dazu so vor:
So geben Sie GPU-VM- oder TPU-Attribute direkt an:
Wählen Sie Maschinentyp angeben aus.
Klicken Sie auf den Tab GPUs oder TPUs und wählen Sie dann den GPU-Maschinentyp oder die TPU-Version aus, die Sie reservieren möchten.
Wenn Sie die Attribute von GPU-VMs mit einer vorhandenen Instanzvorlage angeben möchten, wählen Sie Instanzvorlage und dann die Vorlage aus.
Wenn Sie die Attribute der GPU-VM mithilfe einer vorhandenen VM als Referenz angeben möchten, wählen Sie Vorhandene VM verwenden aus und wählen Sie dann die VM aus.
Wenn Sie im vorherigen Schritt eine TPU v5e (CT5LP) angegeben haben, wählen Sie in der Liste Arbeitslasttyp von TPU v5 eine der folgenden Optionen aus:
Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, wählen Sie Batch aus.
Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, wählen Sie Serving aus.
Führen Sie im Bereich Nach Kapazität suchen die folgenden Schritte aus:
Geben Sie in den Listen Region und Zone die Region und Zone an, in der Sie Ressourcen reservieren möchten. Eine Liste der unterstützten Regionen und Zonen finden Sie unter Einschränkungen.
Geben Sie im Feld Benötigte Gesamtkapazität (beim Reservieren von GPU-VMs) oder in der Liste Anzahl der Chips (beim Reservieren von TPUs) die Anzahl der zu reservierenden GPU-VMs oder TPU-Chips an. Sie können die folgenden Werte angeben:
Bei GPU-VMs ein Wert zwischen
1und80Für TPU-Chips kann ein Wert von
1,4,8,16,32,64,128,256,512oder1024angegeben werden.
Wählen Sie in der Liste Startzeit die Startzeit für Ihre Anfrage aus.
Optional: Wählen Sie in der Liste Flexibilität für Startdatum auswählen aus, wie genau das Startdatum sein muss.
Geben Sie im Feld Reservierungsdauer an, wie lange Sie Ressourcen reservieren möchten.
Klicken Sie auf Nach Kapazität suchen. Wählen Sie dann in der Tabelle Verfügbare Kapazität eine der verfügbaren Optionen aus, die den Typ, die Anzahl und den Reservierungszeitraum der zu reservierenden GPU-VMs oder TPUs enthalten.
Klicken Sie auf Weiter.
Wählen Sie im Abschnitt Freigabetyp die Projekte aus, für die Sie die angeforderte Kapazität freigeben möchten:
Wenn Sie die reservierte Kapazität nur in Ihrem Projekt verwenden möchten, wählen Sie Lokal aus.
Wenn Sie die reservierte Kapazität für andere Projekte freigeben möchten, wählen Sie Freigegeben aus, klicken Sie auf Projekte hinzufügen und folgen Sie der Anleitung, um die Projekte auszuwählen.
Klicken Sie auf Weiter.
Geben Sie im Feld Name der zukünftigen Reservierung einen Namen für die Anfrage ein.
Geben Sie im Feld Name der Reservierung den Namen der Reservierung ein, die Compute Engine automatisch erstellt, um die angeforderte Kapazität bereitzustellen.
Klicken Sie auf Erstellen.
gcloud
Verwenden Sie einen der folgenden
gcloud beta compute future-reservations create-Befehle, um eine Anfrage für vorausschauende Reservierungen im Kalendermodus zu erstellen und zur Überprüfung einzureichen. Fügen Sie je nach den Ressourcen, die Sie reservieren möchten, die folgenden Flags ein:Wenn Sie GPU-VMs reservieren möchten, fügen Sie die Flags
--total-count,--machine-typeund--deployment-type=DENSEein:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONEWenn Sie TPUs reservieren möchten, fügen Sie die Flags
--chip-countund--tpu-versionein:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Ersetzen Sie Folgendes:
FUTURE_RESERVATION_NAME: der Name der Anfrage.NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU-VMs. Der Wert muss zwischen1und80liegen.MACHINE_TYPE: Der GPU-Maschinentyp, der reserviert werden soll. Geben Sie einen der folgenden Werte an:Für A4-Maschinentypen:
a4-highgpu-8gFür A3 Ultra-Maschinentypen:
a3-ultragpu-8g
NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Der Wert muss1,4,8,16,32,64,128,256,512oder1024sein.TPU_VERSION: Die TPU-Version, die reserviert werden soll. Geben Sie einen der folgenden Werte an:Für TPU v6e:
V6EFür TPU v5p:
V5PFür TPU v5e:
V5E
Wenn Sie eine TPU v5e angeben, müssen Sie das Flag
--workload-typeangeben. Setzen Sie das Flag auf den Typ der Arbeitslasten, die Sie auf den TPUs ausführen möchten:Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten (maschinelles Lernen), geben Sie
BATCHan.Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie
SERVINGan.
RESERVATION_NAME: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.SHARE_TYPE: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:So verwenden Sie die Kapazität nur in Ihrem Projekt:
localSo geben Sie Kapazität für andere Projekte frei:
projects
Wenn Sie
projectsangeben, müssen Sie das Flag--share-witheinfügen, das auf eine durch Kommas getrennte Liste von Projekt-IDs festgelegt ist, z. B.project-1,project-2. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Die Projekt-ID darf nicht in dieser Liste enthalten sein. Sie können die reservierte Kapazität standardmäßig nutzen.START_TIME: der Beginn des Antrags, formatiert als RFC 3339-Zeitstempel.END_TIME: das Ende des Reservierungszeitraums, formatiert als RFC 3339-Zeitstempel. Wenn Sie für den Reservierungszeitraum anstelle eines Endzeitpunkts eine Dauer in Sekunden angeben möchten, ersetzen Sie das Flag--end-timedurch das--duration-Flag.ZONE: die Zone, in der Sie Ressourcen reservieren möchten.
REST
Wenn Sie eine Anfrage für vorausschauende Reservierungen im Kalendermodus erstellen und zur Überprüfung einreichen möchten, senden Sie die folgende
POST-Anfrage an die Beta-MethodefutureReservations.insert. Fügen Sie je nach den Ressourcen, die Sie reservieren möchten, die folgenden Felder in den Anfragetext ein:Wenn Sie GPU-VMs reservieren möchten, fügen Sie die Felder
totalCountundmachineTypesowie das FelddeploymentTypemit dem WertDENSEein:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }Wenn Sie TPUs reservieren möchten, geben Sie die Felder
acceleratorCountundvmFamilyan:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Ersetzen Sie Folgendes:
PROJECT_ID: die ID des Projekts, in dem Sie die Anfrage erstellen möchten.ZONE: die Zone, in der Sie Ressourcen reservieren möchten.FUTURE_RESERVATION_NAME: der Name der Anfrage.RESERVATION_NAME: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.SHARE_TYPE: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:So verwenden Sie die Kapazität nur in Ihrem Projekt:
LOCALSo geben Sie Kapazität für andere Projekte frei:
SPECIFIC_PROJECTS
Wenn Sie
SPECIFIC_PROJECTSangeben, müssen Sie im FeldshareSettingsdas FeldprojectMapangeben, um die Projekte anzugeben, mit denen die Kapazität geteilt werden soll. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Geben Sie Ihre Projekt-ID nicht an. Sie können die reservierte Kapazität standardmäßig nutzen.Wenn Sie beispielsweise die angeforderte Kapazität für zwei andere Projekte freigeben möchten, fügen Sie Folgendes ein:
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }Ersetzen Sie
CONSUMER_PROJECT_ID_1undCONSUMER_PROJECT_ID_2durch die IDs von zwei Projekten, die die angeforderte Kapazität nutzen dürfen.NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU-VMs. Der Wert muss zwischen1und80liegen.MACHINE_TYPE: Der GPU-Maschinentyp, der reserviert werden soll. Geben Sie einen der folgenden Werte an:Für A4-Maschinentypen:
a4-highgpu-8gFür A3 Ultra-Maschinentypen:
a3-ultragpu-8g
NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips. Der Wert muss1,4,8,16,32,64,128,256,512oder1024sein.TPU_VERSION: Die TPU-Version, die reserviert werden soll. Geben Sie einen der folgenden Werte an:Für TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6EFür TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PFür TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Wenn Sie eine TPU v5e angeben, müssen Sie im Feld
aggregateResourcesdas FeldworkloadTypeangeben. Legen Sie das Feld auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, geben Sie
BATCHan.Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie
SERVINGan.
START_TIME: der Beginn des Antrags, formatiert als RFC 3339-Zeitstempel.END_TIME: das Ende des Reservierungszeitraums, formatiert als RFC 3339-Zeitstempel. Wenn Sie anstelle einer Endzeit eine Dauer in Sekunden für Ihren Reservierungszeitraum angeben möchten, ersetzen Sie das FeldendTimedurch dasduration-Feld.
Nächste Schritte
Automatisch erstellte Reservierung für GPU-VMs in Compute Engine nutzen
Automatisch erstellte Reservierung für TPUs in Cloud TPU nutzen
Automatisch erstellte Reservierung mit Vertex AI-Vorhersagejobs nutzen
Automatisch erstellte Reservierung mit Vertex AI-Trainingsjobs verwenden
Reservierungen oder Anfragen für vorausschauende Reservierungen ansehen
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-10-19 (UTC).
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-10-19 (UTC)."],[],[]] -