Ce document explique comment créer une demande de réservation future en mode Agenda. Utilisez ces demandes pour réserver des ressources très demandées afin de créer des instances de machines virtuelles (VM) qui s'exécutent pendant 90 jours maximum. Par exemple, vous pouvez utiliser des réservations futures en mode Agenda pour réserver des ressources GPU ou TPU pour vos VM.
Vous pouvez utiliser les demandes de réservations futures en mode Agenda pour réserver des ressources très demandées afin d'exécuter les charges de travail suivantes :
Jobs de pré-entraînement de modèles
Jobs d'affinage de modèles
Charges de travail de simulation de calcul hautes performances (HPC)
Augmentations à court terme des charges de travail d'inférence
Une fois que Google Cloud a approuvé une demande en mode Agenda, vos ressources réservées deviennent disponibles pour vous permettre de créer des VM GPU, H4D ou TPU à la date et à l'heure de livraison spécifiées. Pour en savoir plus sur les exigences et les limites que vous appliquez lorsque vous créez une demande en mode Agenda, consultez Présentation des demandes de réservations futures en mode Agenda.
Avant de commencer
- Si vous ne pouvez pas utiliser les demandes de réservations futures en mode Agenda, vous ne pourrez peut-être pas accéder à cette fonctionnalité ni l'utiliser. Dans ce cas, contactez votre équipe chargée de votre compte ou l'équipe commerciale.
- Pour partager votre capacité réservée avec d'autres projets de votre organisation, assurez-vous que le projet dans lequel vous souhaitez créer des requêtes de réservations futures en mode Agenda est autorisé à créer des réservations partagées. Sinon, vous rencontrerez des erreurs.
-
Si ce n'est pas déjà fait, configurez l'authentification.
L'authentification permet de valider votre identité pour accéder aux services et aux API Google Cloud . Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :
gcloud initSi vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
- Set a default region and zone.
REST
Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.
Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :
gcloud initSi vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .
Rôles requis
Pour obtenir les autorisations nécessaires pour créer une demande de réservation future en mode calendrier, demandez à votre administrateur de vous accorder le rôle IAM Utilisateur des réservations futures Compute (
roles/compute.futureReservationUser) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.Ce rôle prédéfini contient les autorisations requises pour créer une demande de réservation future en mode calendrier. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Vous devez disposer des autorisations suivantes pour créer une demande de réservation future en mode Agenda :
-
Pour créer une requête de réservation future :
compute.futureReservations.createsur le projet -
Pour permettre à Compute Engine de créer automatiquement des réservations :
compute.reservations.createsur le projet -
Pour afficher la disponibilité future des ressources :
compute.advice.calendarModesur le projet
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Présentation
Pour créer une demande de réservation future en mode Agenda, procédez comme suit :
Afficher la disponibilité future des ressources Affichez la disponibilité future des VM GPU, des VM H4D ou des TPU que vous souhaitez réserver. Ensuite, lorsque vous créez une demande, spécifiez le nombre, le type et la durée de réservation des ressources que vous avez confirmées comme disponibles. Google Cloud est plus susceptible d'approuver votre demande si vous fournissez ces informations.
Créez une demande de réservation pour des VM avec GPU, des VM H4D ou des TPU. Créez et envoyez une demande de réservation future en mode Agenda pour des VM avec GPU, des VM H4D ou des TPU. Si vous parvenez à créer une demande, Google Cloudl'approuve en une minute.
Afficher la disponibilité future des ressources
Pour afficher la disponibilité future des VM GPU, des VM H4D ou des TPU dans une région :
- Pour les VM GPU : jusqu'à 60 jours à l'avance
- Pour les VM H4D : jusqu'à 120 jours à l'avance
- Pour les TPU, jusqu'à 120 jours à l'avance
Pour afficher la disponibilité future des VM GPU, des VM H4D ou des TPU dans une région, sélectionnez l'une des options suivantes :
Console
Vous pouvez consulter la disponibilité future des VM GPU, des VM H4D ou des TPU dans une région lorsque vous créez une demande de réservation future en mode Agenda. Pour en savoir plus, consultez Créer une demande de réservation pour des VM avec GPU, des VM H4D ou des TPU dans ce document.
gcloud
Pour afficher la future disponibilité des VM GPU, des VM H4D ou des TPU dans une région, utilisez l'une des commandes
gcloud beta compute advice calendar-modesuivantes. En fonction des ressources que vous souhaitez afficher, incluez les indicateurs suivants :Pour afficher la disponibilité des VM GPU ou H4D, incluez les options
--vm-countet--machine-type:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIMEPour afficher la disponibilité des TPU, incluez les options
--chip-countet--tpu-version:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Remplacez les éléments suivants :
NUMBER_OF_VMS: nombre de VM à réserver. La valeur doit être au moins égale à1et ne doit pas dépasser80pour les VM GPU ni256pour les VM HPC H4D.MACHINE_TYPE: type de machine GPU ou H4D à réserver. Spécifiez une des valeurs suivantes :Pour les types de machines A4 :
a4-highgpu-8gPour les types de machines A3 Ultra :
a3-ultragpu-8gPour les types de machines A3 Mega :
a3-megagpu-8gPour les types de machines A3 High avec 8 GPU :
a3-highgpu-8gPour les types de machines H4D HPC : consultez Types de machines H4D.
NUMBER_OF_CHIPS: nombre de puces TPU à réserver. La valeur doit être1,4,8,16,32,64,128,256,512ou1024.TPU_VERSION: version de TPU à réserver. Spécifiez l'une des valeurs suivantes :Pour les TPU7x :
TPU7XPour les TPU v6e :
V6EPour les TPU v5p :
V5PPour les TPU v5e :
V5E
Si vous spécifiez un TPU v5e, vous devez inclure l'option
--workload-type. Définissez ce flag sur le type de charges de travail que vous souhaitez exécuter sur les TPU :Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement de machine learning (ML), spécifiez
BATCH.Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence de ML, spécifiez
SERVING.
REGION: région dans laquelle réserver des VM avec GPU, des VM H4D ou des TPU. Pour vérifier les régions et les zones compatibles, consultez Limites.FROM_START_TIMEetTO_START_TIME: date la plus ancienne et la plus récente auxquelles vous souhaitez réserver de la capacité. Formatez ces dates en tant que codes temporels RFC 3339 :YYYY-MM-DDTHH:MM:SSOFFSETRemplacez les éléments suivants :
YYYY-MM-DD: date respectant la syntaxe année à quatre chiffres, mois à deux chiffres et jour à deux chiffres, séparés par des traits d'union (-).HH:MM:SS: heure respectant la syntaxe heures à deux chiffres sur 24 heures, minutes à deux chiffres et secondes à deux chiffres, séparés par des signes deux-points (:).OFFSET: fuseau horaire formaté en tant que décalage par rapport au temps universel coordonné (UTC). Par exemple, pour utiliser l'heure normale du Pacifique (PST), spécifiez-08:00. Pour n'utiliser aucun décalage, spécifiezZ.
FROM_END_TIMEetTO_END_TIME: date la plus ancienne et la plus récente auxquelles vous souhaitez que votre réservation de capacité se termine. Formatez ces dates en tant que codes temporels RFC 3339. Si vous souhaitez spécifier une plage de durées pour votre période de réservation au lieu d'heures de fin, remplacez l'indicateur--end-time-rangepar l'indicateur--duration-range.
Le résultat ressemble à ce qui suit :
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-central1-a otherLocations: zones/us-central1-b: details: Recommendation in this zone is possible. status: RECOMMENDED zones/us-central1-c: details: Temporarily no free capacity in this zone in the requested time window. status: NO_CAPACITY zones/us-central1-f: details: This machine family is not supported in this zone. status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'Si les ressources demandées sont disponibles, la sortie contient les champs
startTime,endTimeetlocation. Ces champs spécifient l'heure de début la plus tôt, l'heure de fin la plus tardive et les zones où les ressources sont disponibles.REST
Pour afficher la disponibilité future des VM avec GPU, des VM H4D ou des TPU dans une région, envoyez une requête
GETà la méthode bêtaadvice.calendarMode. En fonction des ressources que vous souhaitez afficher, incluez les champs suivants dans le corps de la requête :Pour afficher la disponibilité des VM GPU ou H4D, incluez les champs
instanceCountetmachineType:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }Pour afficher la disponibilité des TPU, incluez les champs
acceleratorCountetvmFamily:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Remplacez les éléments suivants :
PROJECT_ID: ID du projet dans lequel vous souhaitez réserver des ressources.REGION: région dans laquelle vous souhaitez réserver des VM avec GPU, des VM H4D ou des TPU. Pour vérifier les régions et les zones compatibles, consultez Limites.NUMBER_OF_VMS: nombre de VM GPU ou H4D à réserver. Pour les VM GPU, la valeur doit être comprise entre1et80. Pour les VM H4D, la valeur doit être comprise entre1et256.MACHINE_TYPE: type de machine GPU ou H4D à réserver. Spécifiez une des valeurs suivantes :Pour les types de machines A4 :
a4-highgpu-8gPour les types de machines A3 Ultra :
a3-ultragpu-8gPour les types de machines A3 Mega :
a3-megagpu-8gPour les types de machines A3 High avec 8 GPU :
a3-highgpu-8gPour les types de machines H4D HPC : consultez Types de machines H4D.
NUMBER_OF_CHIPS: nombre de puces TPU à réserver. La valeur doit être1,4,8,16,32,64,128,256,512ou1024.TPU_VERSION: version de TPU à réserver. Spécifiez l'une des valeurs suivantes :Pour les TPU7x :
VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7XPour les TPU v6e :
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6EPour les TPU v5p :
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5PPour les TPU v5e :
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Si vous spécifiez un TPU v5e, vous devez inclure le champ
workloadTypedans le champaggregateResources. Définissez ce champ sur le type de charges de travail que vous souhaitez exécuter sur les TPU :Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement de machine learning (ML), spécifiez
BATCH.Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence de ML, spécifiez
SERVING.
FROM_START_TIMEetTO_START_TIME: date la plus ancienne et la plus récente auxquelles vous souhaitez réserver de la capacité. Formatez ces dates en tant que codes temporels RFC 3339 :YYYY-MM-DDTHH:MM:SSOFFSETRemplacez les éléments suivants :
YYYY-MM-DD: date respectant la syntaxe année à 4 chiffres, mois à 2 chiffres et jour à 2 chiffres, séparés par des traits d'union (-).HH:MM:SS: heure respectant la syntaxe heures à 2 chiffres sur 24 heures, minutes à 2 chiffres et secondes à 2 chiffres, séparés par des signes deux-points (:).OFFSET: fuseau horaire mis en forme en tant que décalage par rapport au temps universel coordonné (UTC). Par exemple, pour utiliser l'heure normale du Pacifique (PST), spécifiez-08:00. Pour n'utiliser aucun décalage, spécifiezZ.
FROM_END_TIMEetTO_END_TIME: date la plus ancienne et la plus récente auxquelles vous souhaitez que votre réservation de capacité se termine. Formatez ces dates en tant que codes temporels RFC 3339. Si vous souhaitez spécifier une plage de durées pour votre période de réservation au lieu d'heures de fin, remplacez les champsendTimeNotEarlierThanetendTimeNotLaterThanpar les champsminDurationetmaxDuration.
Le résultat ressemble à ce qui suit :
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-central1-b": { "status": "RECOMMENDED", "details": "Recommendation in this zone is possible." }, "zones/us-central1-c": { "status": "NO_CAPACITY", "details": "Temporarily no free capacity in this zone in the requested time window." }, "zones/us-central1-f": { "status": "NOT_SUPPORTED", "details": "This machine family is not supported in this zone." } }, "location": "zones/us-central1-a" } } } ] }Si les ressources demandées sont disponibles, la sortie contient les champs
startTime,endTimeetlocation. Ces champs spécifient l'heure de début la plus tôt, l'heure de fin la plus tardive et les zones où les ressources sont disponibles.Créer une demande de réservation pour des VM avec GPU, des VM H4D ou des TPU
Lorsque vous créez une requête de réservation future en mode Agenda, vous ne pouvez spécifier une période de réservation que comme suit :
Heure de début : en fonction des ressources que vous souhaitez réserver, vous devez spécifier une heure de début qui correspond à au moins l'une des valeurs suivantes à partir du moment où vous créez et envoyez une demande :
Pour les VM GPU et H4D : 87 heures (3 jours et 15 heures)
Pour les TPU : 6 heures
Heure de fin : vous pouvez réserver des ressources pour une durée maximale de 90 jours.
Pour créer une demande en utilisant une VM GPU ou H4D existante comme référence, utilisez la consoleGoogle Cloud . Sinon, sélectionnez l'une des options suivantes :
Console
Dans la console Google Cloud , accédez à la page Réservations.
Cliquez sur l'onglet Réservations futures.
Cliquez sur Créer une réservation future. La page Créer une réservation future s'affiche et le volet Configuration matérielle est sélectionné.
Dans la section Configurations, spécifiez les propriétés des VM GPU, des VM H4D ou des TPU que vous souhaitez réserver en procédant de l'une des manières suivantes :
Pour spécifier directement les propriétés des VM GPU, des VM H4D ou des TPU, procédez comme suit :
Sélectionnez Spécifier un type de machine.
Cliquez sur l'onglet GPU, TPU ou Optimisé pour le calcul, puis sélectionnez un type de machine GPU, un type de machine H4D ou une version de TPU compatible.
Pour spécifier les propriétés d'une VM GPU ou H4D en utilisant une VM existante comme référence, sélectionnez Utiliser une VM existante, puis sélectionnez la VM.
Si vous avez spécifié un TPU v5e (CT5LP) à l'étape précédente, sélectionnez l'une des options suivantes dans la liste Type de charge de travail TPU v5 :
Pour exécuter des charges de travail sur les TPU qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement de ML, sélectionnez Batch.
Pour exécuter des charges de travail sur les TPU qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence de ML, sélectionnez Diffusion.
Dans la section Rechercher une capacité, procédez comme suit :
Dans les listes Région et Zone, spécifiez la région et la zone dans lesquelles vous souhaitez réserver des ressources.
Dans le champ Capacité totale nécessaire (lors de la réservation de VM GPU ou H4D) ou dans la liste Nombre de puces (lors de la réservation de TPU), spécifiez le nombre de VM GPU, de VM H4D ou de puces TPU à réserver. Vous pouvez spécifier les valeurs suivantes :
- Pour les VM GPU, une valeur comprise entre
1et80 - Pour les VM H4D, une valeur comprise entre
1et256 - Pour les puces TPU, une valeur de
1,4,8,16,32,64,128,256,512ou1024
- Pour les VM GPU, une valeur comprise entre
Dans la liste Heure de début, sélectionnez l'heure de début de votre demande.
Facultatif : Dans la liste Choisir la flexibilité de la date de début, sélectionnez le degré de précision de votre date de début.
Dans le champ Durée de la réservation, spécifiez la durée pendant laquelle vous souhaitez réserver des ressources.
Cliquez sur Rechercher une capacité. Ensuite, dans le tableau Capacité disponible, sélectionnez l'une des options disponibles qui contiennent le type, le nombre et la période de réservation des VM GPU, des VM H4D ou des TPU à réserver.
Cliquez sur Suivant.
Dans la section Type de partage, sélectionnez les projets avec lesquels partager la capacité demandée :
Pour utiliser la capacité réservée uniquement dans votre projet, sélectionnez Local.
Pour partager la capacité réservée avec d'autres projets, sélectionnez Partagé, cliquez sur Ajouter des projets, puis suivez les instructions pour sélectionner les projets.
Cliquez sur Suivant.
Dans le champ Nom de la réservation future, saisissez un nom pour la demande.
Dans le champ Nom de la réservation, saisissez le nom de la réservation que Compute Engine crée automatiquement pour provisionner la capacité demandée.
Cliquez sur Créer.
gcloud
Pour créer une demande de réservation future en mode Agenda et l'envoyer à des fins d'examen, utilisez l'une des commandes
gcloud beta compute future-reservations createsuivantes. En fonction des ressources que vous souhaitez réserver, incluez les indicateurs suivants :Pour réserver des VM GPU ou H4D, incluez les options
--total-count,--machine-typeet--deployment-type=DENSE:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONEPour réserver des TPU, incluez les options
--chip-countet--tpu-version:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Remplacez les éléments suivants :
FUTURE_RESERVATION_NAME: nom de la demande.NUMBER_OF_VMS: nombre de VM GPU ou H4D à réserver. Pour les VM GPU, la valeur doit être comprise entre1et80. Pour les VM H4D, la valeur doit être comprise entre1et256. Spécifiez un nombre de VM égal ou inférieur au nombre de VM que vous avez confirmées comme disponibles.MACHINE_TYPE: type de machine GPU ou H4D à réserver.NUMBER_OF_CHIPS: nombre de puces TPU à réserver. Spécifiez une valeur égale ou inférieure au nombre de composants que vous avez confirmés comme disponibles. La valeur doit être l'une des suivantes :1,4,8,16,32,64,128,256,512ou1024.TPU_VERSION: version de TPU à réserver. Si vous spécifiez un TPU v5e (V5E), vous devez inclure l'indicateur--workload-typepour spécifier le type de charges de travail à exécuter sur les TPU.RESERVATION_NAME: nom de la réservation que Compute Engine crée automatiquement pour provisionner la capacité demandée.SHARE_TYPE: indique si d'autres projets de votre organisation peuvent utiliser la capacité réservée. Spécifiez une des valeurs suivantes :Pour utiliser la capacité uniquement dans votre projet :
localPour partager de la capacité avec d'autres projets :
projects
Si vous spécifiez
projects, vous devez inclure l'indicateur--share-withdéfini sur une liste d'ID de projet séparés par une virgule (par exemple,project-1,project-2). Vous pouvez spécifier jusqu'à 100 projets dans votre organisation. N'incluez pas l'ID de votre projet dans cette liste. Vous pouvez utiliser la capacité réservée par défaut.START_TIME: heure de début de la demande, que vous devez mettre au format de code temporel RFC 3339.END_TIME: heure de fin de votre période de réservation, que vous devez mettre au format de code temporel RFC 3339. Si vous souhaitez spécifier une durée, en secondes, pour votre période de réservation au lieu d'une heure de fin, remplacez l'indicateur--end-timepar l'indicateur--duration.ZONE: la zone dans laquelle vous souhaitez réserver des ressources.
REST
Pour créer une demande de réservation future en mode Agenda et l'envoyer pour examen, envoyez la requête
POSTsuivante à la méthodefutureReservations.insertbêta. En fonction des ressources que vous souhaitez réserver, incluez les champs suivants dans le corps de la requête :Pour réserver des VM GPU ou H4D, incluez les champs
totalCountetmachineType, ainsi que le champdeploymentTypedéfini surDENSE:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }Pour réserver des TPU, incluez les champs
acceleratorCountetvmFamily:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Remplacez les éléments suivants :
PROJECT_ID: ID du projet dans lequel vous souhaitez créer la requête.ZONE: la zone dans laquelle vous souhaitez réserver des ressources.FUTURE_RESERVATION_NAME: nom de la demande.RESERVATION_NAME: nom de la réservation que Compute Engine crée automatiquement pour provisionner la capacité demandée.SHARE_TYPE: indique si d'autres projets de votre organisation peuvent utiliser la capacité réservée. Spécifiez une des valeurs suivantes :Pour utiliser la capacité uniquement dans votre projet :
LOCALPour partager de la capacité avec d'autres projets :
SPECIFIC_PROJECTS
Si vous spécifiez
SPECIFIC_PROJECTS, vous devez inclure le champprojectMapdans le champshareSettingspour spécifier les projets avec lesquels partager la capacité. Vous pouvez spécifier jusqu'à 100 projets dans votre organisation. N'indiquez pas l'ID de votre projet. Vous pouvez utiliser la capacité réservée par défaut.Par exemple, pour partager la capacité demandée avec deux autres projets, incluez les éléments suivants :
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }Remplacez
CONSUMER_PROJECT_ID_1etCONSUMER_PROJECT_ID_2par les ID des deux projets que vous souhaitez autoriser à consommer la capacité demandée.NUMBER_OF_VMS: nombre de VM GPU ou H4D à réserver. Pour les VM GPU, la valeur doit être comprise entre1et80. Pour les VM H4D, la valeur doit être comprise entre1et256. Spécifiez un nombre de VM égal ou inférieur au nombre de VM que vous avez confirmées comme disponibles.MACHINE_TYPE: type de machine GPU ou H4D à réserver.NUMBER_OF_CHIPS: nombre de puces TPU à réserver. Spécifiez une valeur égale ou inférieure au nombre de composants que vous avez confirmés comme disponibles. La valeur doit être l'une des suivantes :1,4,8,16,32,64,128,256,512ou1024.TPU_VERSION: version de TPU à réserver. Si vous spécifiez un TPU v5e (VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP), vous devez inclure le champworkloadTypedans le champaggregateResourcespour spécifier le type de charges de travail à exécuter sur les TPU.START_TIME: heure de début de la demande, que vous devez mettre au format de code temporel RFC 3339.END_TIME: heure de fin de votre période de réservation, que vous devez mettre au format de code temporel RFC 3339. Si vous souhaitez spécifier une durée, en secondes, pour votre période de réservation au lieu d'une heure de fin, remplacez le champendTimepar le champduration.
Étapes suivantes
Pour les VM GPU ou H4D, consommez une réservation créée automatiquement dans Compute Engine :
Consommer une réservation créée automatiquement pour les VM avec GPU ou les TPU dans Vertex AI :
Utiliser une réservation créée automatiquement pour les TPU dans Cloud TPU
Afficher les réservations ou les demandes de réservations futures
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/12/10 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/12/10 (UTC)."],[],[]] -