Créer une VM qui utilise le modèle lié à la réservation

Ce document explique comment créer une instance de machine virtuelle (VM) autonome à l'aide du modèle de provisionnement lié à la réservation. Ce modèle de provisionnement vous permet de créer des VM A4X, A4, A3 Ultra, A3 Mega ou A3 High (8 GPU) en consommant la capacité pré-réservée.

Pour découvrir d'autres méthodes de création de VM à l'aide du modèle de provisionnement lié à la réservation, consultez Présentation des options de déploiement dans la documentation AI Hypercomputer.

Avant de commencer

  • Si ce n'est pas déjà fait, configurez l'authentification. L'authentification permet de valider votre identité pour accéder aux services et aux API Google Cloud . Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

      gcloud init

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

    2. Set a default region and zone.

    REST

    Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.

      Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

      gcloud init

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

    Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .

Rôles requis

Pour obtenir les autorisations nécessaires à la création de VM à l'aide du modèle de provisionnement lié à une réservation, demandez à votre administrateur de vous attribuer le rôle IAM Administrateur d'instances Compute (v1) (roles/compute.instanceAdmin.v1) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Ce rôle prédéfini contient les autorisations requises pour créer des VM à l'aide du modèle de provisionnement lié à une réservation. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Les autorisations suivantes sont requises pour créer des VM à l'aide du modèle de provisionnement lié à la réservation :

  • compute.instances.create sur le projet
  • Pour créer la VM à l'aide d'une image personnalisée : compute.images.useReadOnly sur l'image
  • Pour créer la VM à l'aide d'un instantané : compute.snapshots.useReadOnly sur l'instantané
  • Pour créer la VM à l'aide d'un modèle d'instance : compute.instanceTemplates.useReadOnly sur le modèle d'instance
  • Pour spécifier un sous-réseau pour la VM : compute.subnetworks.use sur le projet ou sur le sous-réseau choisi
  • Pour spécifier une adresse IP statique pour la VM : compute.addresses.use sur le projet
  • Pour attribuer une adresse IP externe à la VM en cas d'utilisation d'un réseau VPC : compute.subnetworks.useExternalIp sur le projet ou sur le sous-réseau choisi
  • Pour attribuer un ancien réseau à la VM : compute.networks.use sur le projet
  • Pour attribuer une adresse IP externe à la VM en cas d'utilisation d'un ancien réseau : compute.networks.useExternalIp sur le projet
  • Pour définir les métadonnées d'instance de VM pour la VM : compute.instances.setMetadata sur le projet
  • Pour définir des tags pour la VM : compute.instances.setTags sur la VM
  • Pour définir des étiquettes pour la VM : compute.instances.setLabels sur la VM
  • Pour définir un compte de service que doit utiliser la VM : compute.instances.setServiceAccount sur la VM
  • Pour créer un disque pour la VM : compute.disks.create sur le projet
  • Pour associer un disque existant en mode lecture seule ou en mode lecture-écriture : compute.disks.use sur le disque
  • Pour associer un disque existant en mode lecture seule : compute.disks.useReadOnly sur le disque

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Créer une VM qui utilise le modèle de provisionnement lié à la réservation

Pour créer une VM A4X, ou une VM A4, A3 Ultra, A3 Mega ou A3 High (8 GPU) à l'aide du modèle de provisionnement lié à la réservation, vous devez attendre que la réservation automatique que vous souhaitez utiliser atteigne son heure de début. De plus, la VM que vous souhaitez créer doit répondre à toutes les exigences suivantes :

L'exemple suivant crée une demande de réservation future en mode Agenda pour cinq VM A3 Ultra, puis crée une VM A3 Ultra en utilisant la réservation créée automatiquement pour la demande.

Pour créer une VM d'exemple à l'aide du modèle de provisionnement lié à la réservation, sélectionnez l'une des options suivantes :

Console

  1. Créez un exemple de demande pour cinq VM A3 Ultra et envoyez-le pour examen :

    1. Dans la console Google Cloud , accédez à la page Réservations.

      Accéder à la page "Réservations"

    2. Cliquez sur l'onglet Réservations futures.

    3. Cliquez sur Créer une réservation future. La page Créer une réservation future s'affiche.

    4. Dans la section Configuration matérielle, sélectionnez Spécifier un type de machine, puis spécifiez une instance A3 Ultra.

    5. Dans la section Méthode d'obtention, procédez comme suit :

      1. Sélectionnez Rechercher une capacité pour une durée maximale de 90 jours.

      2. Dans les listes Région et Zone, spécifiez la région et la zone dans lesquelles réserver des ressources. Pour cet exemple, sélectionnez respectivement us-central1 et us-central1-a.

      3. Dans le champ Capacité totale nécessaire, saisissez 5.

      4. Dans la section Période de réservation, spécifiez la période de réservation.

    6. Spécifiez les champs restants, puis cliquez sur Envoyer.

  2. À l'heure de début de la requête, pour créer une VM A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, procédez comme suit :

    1. Dans la console Google Cloud , accédez à la page Créer une instance.

      Accéder à la page Créer une instance

    2. Dans le champ Nom, saisissez un nom pour la VM. Pour cet exemple, saisissez example-vm.

    3. Spécifiez la région et la zone dans lesquelles vous souhaitez réserver des ressources. Pour cet exemple, sélectionnez respectivement us-central1 et us-central1-a.

    4. Cliquez sur l'onglet GPU, puis, dans la liste Type de GPU, sélectionnez NVIDIA H200 141 Go. Cette action spécifie une VM A3 Ultra et définit le modèle de provisionnement sur Lié à une réservation.

    5. Dans le menu de navigation, cliquez sur Avancé.

    6. Dans la section Réservations, sélectionnez Choisir une réservation, puis cliquez sur Choisir une réservation.

    7. Dans le volet Choisir une réservation, procédez comme suit :

      1. Sélectionnez une réservation spécifique. Si vous souhaitez utiliser une réservation partagée qui existe dans un autre projet, sélectionnez le projet dans lequel la réservation existe dans la liste Projet.

      2. Cliquez sur Choisir.

    8. Dans la section Modèle de provisionnement, développez la section Paramètres avancés du modèle de provisionnement de VM.

    9. Dans la liste À l'arrêt de la VM, sélectionnez Arrêter (par défaut) ou Supprimer.

    10. Cliquez sur Créer.

gcloud

  1. Pour créer un exemple de demande de cinq VM A3 Ultra et l'envoyer pour examen, utilisez la commande gcloud beta compute future-reservations create :

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-type=local \
        --start-time=2025-10-05T00:00:00Z \
        --end-time=2025-10-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-a
    

    Supposons que Google Cloud approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la demande, le 5 octobre 2025, Compute Engine augmente le nombre de VM GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.

  2. À l'heure de début de la requête, pour créer une VM A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, utilisez la commande gcloud compute instances create avec les options suivantes :

    • L'option --instance-termination-action

    • L'option --provisioning-model est définie sur RESERVATION_BOUND.

    • L'option --reservation

    • L'option --reservation-affinity est définie sur specific.

    La commande ressemble à ce qui suit. Pour connaître toutes les exigences requises pour créer une VM A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.

    gcloud compute instance create example-vm  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-a \
        ...
    

    La commande inclut les valeurs suivantes :

    • TERMINATION_ACTION : indique si Compute Engine arrête (STOP) ou supprime (DELETE) la VM à la fin de la période de réservation.

    • RESERVATION_URL : URL de la réservation, que vous devez mettre en forme comme suit :

      • Si la réservation créée automatiquement existe dans votre projet : example-reservation.

      • Si la réservation créée automatiquement existe dans un autre projet : projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Pour créer un exemple de demande pour cinq VM A3 Ultra et l'envoyer pour examen, envoyez une requête POST à la méthode futureReservations.insert bêta :

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2025-10-05T00:00:00Z",
        "endTime": "2025-10-19T00:00:00Z"
      }
    }
    

    Supposons que Google Cloud approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la demande, le 5 octobre 2025, Compute Engine augmente le nombre de VM GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.

  2. À l'heure de début de la demande, pour créer une VM A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, envoyez une requête POST à la méthode instances.insert. Dans le corps de la requête, incluez les champs suivants :

    • Le champ reservationAffinity.consumeReservationType défini sur SPECIFIC_RESERVATION.

    • Le champ reservationAffinity.key défini sur compute.googleapis.com/reservation-name.

    • Le champ reservationAffinity.values défini sur l'URL de la réservation.

    • Le champ scheduling.instanceTerminationAction.

    • Le champ scheduling.provisioningModel défini sur RESERVATION_BOUND.

    La requête ressemble à ce qui suit. Pour connaître toutes les exigences requises pour créer une VM A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g",
        "name": "example-vm",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Le corps de la requête inclut les valeurs suivantes :

    • RESERVATION_URL : URL de la réservation, que vous devez mettre en forme comme suit :

      • Si la réservation créée automatiquement existe dans votre projet : example-reservation.

      • Si la réservation créée automatiquement existe dans un autre projet : projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION : indique si Compute Engine arrête (STOP) ou supprime (DELETE) la VM à la fin de la période de réservation.

Étapes suivantes

Faites l'essai

Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de Compute Engine en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits offerts pour exécuter, tester et déployer des charges de travail.

Profiter d'un essai gratuit de Compute Engine