Ce document explique comment créer une instance Compute Engine autonome à l'aide du modèle de provisionnement lié à une réservation. Ce modèle de provisionnement vous permet de créer des instances A4X Max, A4X, A4 ou A3 Ultra en consommant la capacité pré-réservée.
Pour découvrir d'autres méthodes de création d'instances à l'aide du modèle de provisionnement lié à la réservation, consultez Présentation des options de déploiement dans la documentation AI Hypercomputer.
Avant de commencer
-
Si ce n'est pas déjà fait, configurez l'authentification.
L'authentification permet de valider votre identité pour accéder aux services et aux API Google Cloud . Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :
gcloud initSi vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
- Set a default region and zone.
REST
Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.
Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :
gcloud initSi vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .
Rôles requis
Pour obtenir les autorisations nécessaires pour créer des instances de calcul à l'aide du modèle de provisionnement lié à une réservation, demandez à votre administrateur de vous accorder le rôle IAM Administrateur d'instances Compute (v1) (
roles/compute.instanceAdmin.v1) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.Ce rôle prédéfini contient les autorisations requises pour créer des instances de calcul à l'aide du modèle de provisionnement lié à une réservation. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour créer des instances de calcul à l'aide du modèle de provisionnement lié à la réservation :
compute.instances.createsur le projet-
Pour créer la VM à l'aide d'une image personnalisée :
compute.images.useReadOnlysur l'image -
Pour créer la VM à l'aide d'un instantané :
compute.snapshots.useReadOnlysur l'instantané -
Pour créer la VM à l'aide d'un modèle d'instance :
compute.instanceTemplates.useReadOnlysur le modèle d'instance -
Pour spécifier un sous-réseau pour la VM :
compute.subnetworks.usesur le projet ou sur le sous-réseau choisi -
Pour spécifier une adresse IP statique pour la VM :
compute.addresses.usesur le projet -
Pour attribuer une adresse IP externe à la VM en cas d'utilisation d'un réseau VPC :
compute.subnetworks.useExternalIpsur le projet ou sur le sous-réseau choisi -
Pour attribuer un ancien réseau à la VM :
compute.networks.usesur le projet -
Pour attribuer une adresse IP externe à la VM en cas d'utilisation d'un ancien réseau :
compute.networks.useExternalIpsur le projet -
Pour définir les métadonnées d'instance de VM pour la VM :
compute.instances.setMetadatasur le projet -
Pour définir des tags pour la VM :
compute.instances.setTagssur la VM -
Pour définir des étiquettes pour la VM :
compute.instances.setLabelssur la VM -
Pour définir un compte de service que doit utiliser la VM :
compute.instances.setServiceAccountsur la VM -
Pour créer un disque pour la VM :
compute.disks.createsur le projet -
Pour associer un disque existant en mode lecture seule ou en mode lecture-écriture :
compute.disks.usesur le disque -
Pour associer un disque existant en mode lecture seule :
compute.disks.useReadOnlysur le disque
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Créer une instance qui utilise le modèle de provisionnement lié à une réservation
Pour créer une instance de calcul A4X Max, A4X, A4 ou A3 Ultra à l'aide du modèle de provisionnement lié à la réservation, vous devez attendre que la réservation créée automatiquement que vous souhaitez utiliser atteigne son heure de début. De plus, l'instance que vous souhaitez créer doit répondre à toutes les exigences suivantes :
L'instance et la réservation doivent avoir des propriétés correspondantes.
L'instance doit cibler spécifiquement la réservation à utiliser.
L'instance doit être arrêtée ou supprimée à l'heure de fin de la réservation.
L'exemple suivant crée une demande de réservation future en mode Agenda pour cinq instances A3 Ultra, puis crée une instance A3 Ultra en consommant la réservation créée automatiquement pour la demande.
Pour créer une instance exemple à l'aide du modèle de provisionnement lié à la réservation, sélectionnez l'une des options suivantes :
Console
Créez un exemple de demande pour cinq instances A3 Ultra et envoyez-le pour examen :
Dans la console Google Cloud , accédez à la page Réservations.
Cliquez sur l'onglet Réservations futures.
Cliquez sur Créer une réservation future. La page Créer une réservation future s'affiche.
Dans la section Configuration matérielle, sélectionnez Spécifier un type de machine, puis spécifiez une instance A3 Ultra.
Dans la section Méthode d'obtention, procédez comme suit :
Sélectionnez Rechercher une capacité pour une durée maximale de 90 jours.
Dans les listes Région et Zone, spécifiez la région et la zone dans lesquelles réserver des ressources. Pour cet exemple, sélectionnez respectivement us-central1 et us-central1-a.
Dans le champ Capacité totale nécessaire, saisissez
5.Dans la section Période de réservation, spécifiez la période de réservation.
Spécifiez les champs restants, puis cliquez sur Envoyer.
À l'heure de début de la requête, pour créer une instance A3 Ultra afin de consommer l'exemple de réservation créée automatiquement, procédez comme suit :
Dans la console Google Cloud , accédez à la page Créer une instance.
Dans le champ Nom, saisissez un nom pour l'instance. Pour cet exemple, saisissez
example-instance.Spécifiez la région et la zone dans lesquelles vous souhaitez réserver des ressources. Pour cet exemple, sélectionnez respectivement us-central1 et us-central1-a.
Cliquez sur l'onglet GPU, puis, dans la liste Type de GPU, sélectionnez NVIDIA H200 141 Go. Cette action spécifie une instance A3 Ultra et définit le modèle de provisionnement sur Lié à une réservation.
Dans le menu de navigation, cliquez sur Avancé.
Dans la section Réservations, sélectionnez Choisir une réservation, puis cliquez sur Choisir une réservation.
Dans le volet Choisir une réservation, procédez comme suit :
Sélectionnez une réservation spécifique. Si vous souhaitez utiliser une réservation partagée qui existe dans un autre projet, sélectionnez le projet dans lequel la réservation existe dans la liste Projet.
Cliquez sur Choisir.
Dans la section Modèle de provisionnement, développez la section Paramètres avancés du modèle de provisionnement de VM.
Dans la liste À l'arrêt de la VM, sélectionnez Arrêter (par défaut) ou Supprimer.
Cliquez sur Créer.
gcloud
Pour créer un exemple de demande de cinq instances A3 Ultra et l'envoyer pour examen, utilisez la commande
gcloud beta compute future-reservations create:gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-type=local \ --start-time=2025-10-05T00:00:00Z \ --end-time=2025-10-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-aSupposons que Google Cloud approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la demande, le 5 octobre 2025, Compute Engine augmente le nombre d'instances de GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.
À l'heure de début de la requête, pour créer une instance A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, utilisez la commande
gcloud compute instances createavec les options suivantes :L'option
--instance-termination-actionL'option
--provisioning-modelest définie surRESERVATION_BOUND.L'option
--reservationL'option
--reservation-affinityest définie surspecific.
La commande ressemble à ce qui suit. Pour connaître toutes les exigences requises pour créer une instance A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.
gcloud compute instance create example-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-a \ ...La commande inclut les valeurs suivantes :
TERMINATION_ACTION: indique si Compute Engine arrête (STOP) ou supprime (DELETE) l'instance à la fin de la période de réservation.RESERVATION_URL: URL de la réservation, au format suivant :Si la réservation créée automatiquement existe dans votre projet :
example-reservation.Si la réservation créée automatiquement existe dans un autre projet :
projects/PROJECT_ID/reservations/example-reservation.
REST
Pour créer un exemple de demande de cinq instances A3 Ultra et l'envoyer pour examen, envoyez une requête
POSTà la méthodefutureReservations.insertbêta :POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2025-10-05T00:00:00Z", "endTime": "2025-10-19T00:00:00Z" } }Supposons que Google Cloud approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la demande, le 5 octobre 2025, Compute Engine augmente le nombre d'instances de GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.
À l'heure de début de la demande, pour créer une instance A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, envoyez une requête
POSTà la méthodeinstances.insert. Dans le corps de la requête, incluez les champs suivants :Le champ
reservationAffinity.consumeReservationTypeest défini surSPECIFIC_RESERVATION.Le champ
reservationAffinity.keyest défini surcompute.googleapis.com/reservation-name.Le champ
reservationAffinity.valuesdéfini sur l'URL de la réservation.Le champ
scheduling.instanceTerminationAction.Le champ
scheduling.provisioningModeldéfini surRESERVATION_BOUND.
La requête ressemble à ce qui suit : Pour connaître toutes les exigences requises pour créer une instance A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances { { "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g", "name": "example-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }Le corps de la requête inclut les valeurs suivantes :
RESERVATION_URL: URL de la réservation, au format suivant :Si la réservation créée automatiquement existe dans votre projet :
example-reservation.Si la réservation créée automatiquement existe dans un autre projet :
projects/PROJECT_ID/reservations/example-reservation.
TERMINATION_ACTION: indique si Compute Engine arrête (STOP) ou supprime (DELETE) l'instance à la fin de la période de réservation.
Étapes suivantes
Faites l'essai
Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de Compute Engine en conditions réelles. Les nouveaux clients bénéficient également de 300 $de crédits sans frais pour exécuter, tester et déployer des charges de travail.
Profiter d'un essai sans frais de Compute EngineSauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2026/01/14 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2026/01/14 (UTC)."],[],[]] -