Créer une instance avec le modèle lié à la réservation

Ce document explique comment créer une instance Compute Engine autonome à l'aide du modèle de provisionnement lié à une réservation. Ce modèle de provisionnement vous permet de créer des instances A4X Max, A4X, A4 ou A3 Ultra en consommant la capacité pré-réservée.

Pour découvrir d'autres méthodes de création d'instances à l'aide du modèle de provisionnement lié à la réservation, consultez Présentation des options de déploiement dans la documentation AI Hypercomputer.

Avant de commencer

  • Si ce n'est pas déjà fait, configurez l'authentification. L'authentification permet de valider votre identité pour accéder aux services et aux API Google Cloud . Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

      gcloud init

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

    2. Set a default region and zone.

    REST

    Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.

      Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

      gcloud init

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

    Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .

Rôles requis

Pour obtenir les autorisations nécessaires pour créer des instances de calcul à l'aide du modèle de provisionnement lié à une réservation, demandez à votre administrateur de vous accorder le rôle IAM Administrateur d'instances Compute (v1) (roles/compute.instanceAdmin.v1) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Ce rôle prédéfini contient les autorisations requises pour créer des instances de calcul à l'aide du modèle de provisionnement lié à une réservation. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Les autorisations suivantes sont requises pour créer des instances de calcul à l'aide du modèle de provisionnement lié à la réservation :

  • compute.instances.create sur le projet
  • Pour créer la VM à l'aide d'une image personnalisée : compute.images.useReadOnly sur l'image
  • Pour créer la VM à l'aide d'un instantané : compute.snapshots.useReadOnly sur l'instantané
  • Pour créer la VM à l'aide d'un modèle d'instance : compute.instanceTemplates.useReadOnly sur le modèle d'instance
  • Pour spécifier un sous-réseau pour la VM : compute.subnetworks.use sur le projet ou sur le sous-réseau choisi
  • Pour spécifier une adresse IP statique pour la VM : compute.addresses.use sur le projet
  • Pour attribuer une adresse IP externe à la VM en cas d'utilisation d'un réseau VPC : compute.subnetworks.useExternalIp sur le projet ou sur le sous-réseau choisi
  • Pour attribuer un ancien réseau à la VM : compute.networks.use sur le projet
  • Pour attribuer une adresse IP externe à la VM en cas d'utilisation d'un ancien réseau : compute.networks.useExternalIp sur le projet
  • Pour définir les métadonnées d'instance de VM pour la VM : compute.instances.setMetadata sur le projet
  • Pour définir des tags pour la VM : compute.instances.setTags sur la VM
  • Pour définir des étiquettes pour la VM : compute.instances.setLabels sur la VM
  • Pour définir un compte de service que doit utiliser la VM : compute.instances.setServiceAccount sur la VM
  • Pour créer un disque pour la VM : compute.disks.create sur le projet
  • Pour associer un disque existant en mode lecture seule ou en mode lecture-écriture : compute.disks.use sur le disque
  • Pour associer un disque existant en mode lecture seule : compute.disks.useReadOnly sur le disque

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Créer une instance qui utilise le modèle de provisionnement lié à une réservation

Pour créer une instance de calcul A4X Max, A4X, A4 ou A3 Ultra à l'aide du modèle de provisionnement lié à la réservation, vous devez attendre que la réservation créée automatiquement que vous souhaitez utiliser atteigne son heure de début. De plus, l'instance que vous souhaitez créer doit répondre à toutes les exigences suivantes :

L'exemple suivant crée une demande de réservation future en mode Agenda pour cinq instances A3 Ultra, puis crée une instance A3 Ultra en consommant la réservation créée automatiquement pour la demande.

Pour créer une instance exemple à l'aide du modèle de provisionnement lié à la réservation, sélectionnez l'une des options suivantes :

Console

  1. Créez un exemple de demande pour cinq instances A3 Ultra et envoyez-le pour examen :

    1. Dans la console Google Cloud , accédez à la page Réservations.

      Accéder à la page "Réservations"

    2. Cliquez sur l'onglet Réservations futures.

    3. Cliquez sur Créer une réservation future. La page Créer une réservation future s'affiche.

    4. Dans la section Configuration matérielle, sélectionnez Spécifier un type de machine, puis spécifiez une instance A3 Ultra.

    5. Dans la section Méthode d'obtention, procédez comme suit :

      1. Sélectionnez Rechercher une capacité pour une durée maximale de 90 jours.

      2. Dans les listes Région et Zone, spécifiez la région et la zone dans lesquelles réserver des ressources. Pour cet exemple, sélectionnez respectivement us-central1 et us-central1-a.

      3. Dans le champ Capacité totale nécessaire, saisissez 5.

      4. Dans la section Période de réservation, spécifiez la période de réservation.

    6. Spécifiez les champs restants, puis cliquez sur Envoyer.

  2. À l'heure de début de la requête, pour créer une instance A3 Ultra afin de consommer l'exemple de réservation créée automatiquement, procédez comme suit :

    1. Dans la console Google Cloud , accédez à la page Créer une instance.

      Accéder à la page Créer une instance

    2. Dans le champ Nom, saisissez un nom pour l'instance. Pour cet exemple, saisissez example-instance.

    3. Spécifiez la région et la zone dans lesquelles vous souhaitez réserver des ressources. Pour cet exemple, sélectionnez respectivement us-central1 et us-central1-a.

    4. Cliquez sur l'onglet GPU, puis, dans la liste Type de GPU, sélectionnez NVIDIA H200 141 Go. Cette action spécifie une instance A3 Ultra et définit le modèle de provisionnement sur Lié à une réservation.

    5. Dans le menu de navigation, cliquez sur Avancé.

    6. Dans la section Réservations, sélectionnez Choisir une réservation, puis cliquez sur Choisir une réservation.

    7. Dans le volet Choisir une réservation, procédez comme suit :

      1. Sélectionnez une réservation spécifique. Si vous souhaitez utiliser une réservation partagée qui existe dans un autre projet, sélectionnez le projet dans lequel la réservation existe dans la liste Projet.

      2. Cliquez sur Choisir.

    8. Dans la section Modèle de provisionnement, développez la section Paramètres avancés du modèle de provisionnement de VM.

    9. Dans la liste À l'arrêt de la VM, sélectionnez Arrêter (par défaut) ou Supprimer.

    10. Cliquez sur Créer.

gcloud

  1. Pour créer un exemple de demande de cinq instances A3 Ultra et l'envoyer pour examen, utilisez la commande gcloud beta compute future-reservations create :

    gcloud beta compute future-reservations create example-fr \
        --auto-delete-auto-created-reservations \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=example-reservation \
        --share-type=local \
        --start-time=2025-10-05T00:00:00Z \
        --end-time=2025-10-19T00:00:00Z \
        --machine-type=a3-ultragpu-8g \
        --total-count=5 \
        --zone=us-central1-a
    

    Supposons que Google Cloud approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la demande, le 5 octobre 2025, Compute Engine augmente le nombre d'instances de GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.

  2. À l'heure de début de la requête, pour créer une instance A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, utilisez la commande gcloud compute instances create avec les options suivantes :

    • L'option --instance-termination-action

    • L'option --provisioning-model est définie sur RESERVATION_BOUND.

    • L'option --reservation

    • L'option --reservation-affinity est définie sur specific.

    La commande ressemble à ce qui suit. Pour connaître toutes les exigences requises pour créer une instance A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.

    gcloud compute instance create example-instance  \
        --machine-type=a3-ultragpu-8g \
        --instance-termination-action=TERMINATION_ACTION \
        --provisioning-model=RESERVATION_BOUND \
        --reservation-affinity=specific \
        --reservation=RESERVATION_URL \
        --zone=us-central1-a \
        ...
    

    La commande inclut les valeurs suivantes :

    • TERMINATION_ACTION : indique si Compute Engine arrête (STOP) ou supprime (DELETE) l'instance à la fin de la période de réservation.

    • RESERVATION_URL : URL de la réservation, au format suivant :

      • Si la réservation créée automatiquement existe dans votre projet : example-reservation.

      • Si la réservation créée automatiquement existe dans un autre projet : projects/PROJECT_ID/reservations/example-reservation.

REST

  1. Pour créer un exemple de demande de cinq instances A3 Ultra et l'envoyer pour examen, envoyez une requête POST à la méthode futureReservations.insert bêta :

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations
    
    {
      "name": "example-request-calendar-mode",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "example-reservation",
      "shareSettings": {
        "shareType": "LOCAL"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "machineType": "a3-ultragpu-8g",
        "totalCount": 5
      },
      "timeWindow": {
        "startTime": "2025-10-05T00:00:00Z",
        "endTime": "2025-10-19T00:00:00Z"
      }
    }
    

    Supposons que Google Cloud approuve la demande et que Compute Engine crée automatiquement une réservation vide. À l'heure de début de la demande, le 5 octobre 2025, Compute Engine augmente le nombre d'instances de GPU réservées dans la réservation. Vous pouvez ensuite utiliser la réservation.

  2. À l'heure de début de la demande, pour créer une instance A3 Ultra afin d'utiliser l'exemple de réservation créée automatiquement, envoyez une requête POST à la méthode instances.insert. Dans le corps de la requête, incluez les champs suivants :

    • Le champ reservationAffinity.consumeReservationType est défini sur SPECIFIC_RESERVATION.

    • Le champ reservationAffinity.key est défini sur compute.googleapis.com/reservation-name.

    • Le champ reservationAffinity.values défini sur l'URL de la réservation.

    • Le champ scheduling.instanceTerminationAction.

    • Le champ scheduling.provisioningModel défini sur RESERVATION_BOUND.

    La requête ressemble à ce qui suit : Pour connaître toutes les exigences requises pour créer une instance A3 Ultra, consultez plutôt Créer une instance A3 Ultra ou A4.

    POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances
    
    {
      {
        "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g",
        "name": "example-instance",
        "reservationAffinity": {
          "consumeReservationType": "SPECIFIC_RESERVATION",
          "key": "compute.googleapis.com/reservation-name",
          "values":[
            "RESERVATION_URL"
          ],
        },
        "scheduling": {
          "instanceTerminationAction": "TERMINATION_ACTION",
          "provisioningModel": "RESERVATION_BOUND"
        },
        ...
      }
    }
    

    Le corps de la requête inclut les valeurs suivantes :

    • RESERVATION_URL : URL de la réservation, au format suivant :

      • Si la réservation créée automatiquement existe dans votre projet : example-reservation.

      • Si la réservation créée automatiquement existe dans un autre projet : projects/PROJECT_ID/reservations/example-reservation.

    • TERMINATION_ACTION : indique si Compute Engine arrête (STOP) ou supprime (DELETE) l'instance à la fin de la période de réservation.

Étapes suivantes

Faites l'essai

Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de Compute Engine en conditions réelles. Les nouveaux clients bénéficient également de 300 $de crédits sans frais pour exécuter, tester et déployer des charges de travail.

Profiter d'un essai sans frais de Compute Engine