Réserver de la capacité via votre équipe de compte

Ce document explique comment obtenir de la capacité lorsque vous souhaitez utiliser l'option de consommation des réservations futures dans AI Hypercomputer. Pour en savoir plus sur toutes les options de capacité dans AI Hypercomputer, consultez Présentation de la capacité.

Pour vous assurer que vos charges de travail disposent des ressources dont elles ont besoin, demandez une réservation future à Google. Cette action vous permet de réserver des blocs de capacité pour une durée définie, à partir d'une date et d'une heure spécifiques de votre choix. Sur la base de votre demande, Google crée une requête de réservation future brouillon. Une fois que vous avez examiné et envoyé ce brouillon de demande, et que Google Cloudl'a approuvé, Compute Engine crée automatiquement (auto-crée) une réservation vide. Ensuite, à l'heure de début de votre choix, Compute Engine provisionne la capacité demandée dans la réservation créée automatiquement. Vous pouvez ensuite utiliser la réservation pour créer des instances de machines virtuelles (VM) jusqu'à la fin de la période de réservation.

Limites

Cette section décrit les limites des requêtes de réservation futures et des réservations créées automatiquement pour une requête.

Limites applicables aux demandes de réservations futures

Une fois que Google a créé un brouillon de requête de réservation future pour vous, les limites suivantes s'appliquent :

  • Vous ne pouvez pas modifier les détails de la demande, y compris le type de partage.
  • Une fois la demande envoyée et approuvée, et son état passé à PROVISIONING, vous ne pouvez plus l'annuler ni la supprimer. Vous vous engagez à payer la capacité demandée à partir de l'heure de début de la requête, quelle que soit l'utilisation.

Limites pour les réservations créées automatiquement

Une fois que Compute Engine a créé une réservation à la demande pour répondre à la capacité demandée, les limites suivantes s'appliquent :

  • Vous ne pouvez utiliser ou modifier la réservation qu'après l'heure de début de la demande.
  • Vous ne pouvez modifier la réservation que comme suit :

    Pour modifier d'autres propriétés d'une réservation, vous devez contacter l'équipe chargée de votre compte.

  • Vous ne pouvez pas supprimer manuellement la réservation. Si, lorsque vous réservez de la capacité, vous spécifiez que vous ne souhaitez pas supprimer automatiquement la réservation à la fin de sa période de réservation, vous devez contacter l'équipe responsable de votre compte pour supprimer la réservation.

Avant de commencer

  • Si ce n'est pas déjà fait, examinez les configurations de VM et de cluster disponibles.

  • Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

    At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

    REST

    Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.

      Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :

      gcloud init

      Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.

    Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .

Rôles requis

Pour obtenir les autorisations nécessaires pour créer une demande de réservation future, demandez à votre administrateur de vous accorder le rôle IAM Utilisateur de réservation future Compute (roles/compute.futureReservationUser) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Ce rôle prédéfini contient les autorisations requises pour créer une demande de réservation future. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Vous devez disposer des autorisations suivantes pour créer une demande de réservation future :

  • Pour permettre à Compute Engine de créer automatiquement des réservations : compute.reservations.create sur le projet
  • Pour créer une requête de réservation future : compute.futureReservations.create sur le projet
  • Pour spécifier un modèle d'instance : compute.instanceTemplates.useReadOnly sur le modèle d'instance

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Quota

Dans le cadre de la procédure de demande de réservation future, Google gère le quota de vos ressources réservées. Vous n'avez pas besoin de demander de quota. À l'heure de début de votre réservation future approuvée, Google augmente votre quota si vous n'en avez pas assez pour les ressources réservées.

Présentation

Pour réserver des blocs de capacité, procédez comme suit :

  1. Demandez de la capacité à l'équipe responsable de votre compte. Contactez l'équipe responsable de votre compte pour spécifier le type et le nombre de ressources que vous souhaitez réserver.
  2. Examiner et envoyer une demande de réservation brouillon Une fois que Google a créé un brouillon de demande de réservation future, examinez-le. Si tout vous semble correct, envoyez la demande pour examen. Google Cloud l'approuve immédiatement.

Demander de la capacité à votre équipe de compte

Contactez l'équipe chargée de votre compte et fournissez les informations suivantes pour que Google puisse créer un brouillon de demande de réservation future :

  • Numéro de projet : numéro du projet dans lequel votre équipe de compte crée la demande et Compute Engine provisionne la capacité.
  • Type de machine : type de machine à réserver. Vous pouvez spécifier l'une des valeurs suivantes :
    • A4X (a4x-highgpu-4g)
    • A4 (a4-highgpu-8g)
    • A3 Ultra (a3-ultragpu-8g)
    • A3 Mega (a3-megagpu-8g)
    • A3 High (a3-highgpu-8g)
  • Zone : zone dans laquelle vous souhaitez réserver de la capacité. Pour consulter les régions et les zones disponibles pour un type de machine GPU, consultez Disponibilité des accélérateurs.
  • Nombre total : nombre total de VM à réserver. Vous ne pouvez réserver que des multiples de deux VM. La taille des blocs et le nombre de VM par bloc varient en fonction du type de machine et de la disponibilité. L'équipe chargée de votre compte peut vous fournir plus d'informations sur votre demande.
  • Heure de début : heure de début de la période de réservation. Vous pourrez commencer à utiliser la capacité réservée à ce moment-là. Mettez en forme l'heure de début en tant que code temporel RFC 3339 comme suit :
    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Remplacez les éléments suivants :

    • YYYY-MM-DD : date respectant la syntaxe année (valeur à quatre chiffres), mois à deux chiffres et jour à deux chiffres du mois, séparés par des traits d'union (-).
    • HH:MM:SS : heure respectant la syntaxe heures à deux chiffres sur 24 heures, minutes à deux chiffres et secondes à deux chiffres, séparés par des signes deux-points (:).
    • OFFSET : fuseau horaire formaté en tant que décalage par rapport au temps universel coordonné (UTC). Par exemple, pour utiliser l'heure normale du Pacifique (PST), spécifiez -08:00. Pour n'utiliser aucun décalage, spécifiez Z.
  • Heure de fin : heure de fin de la période de réservation. Mettez-la en forme en tant que code temporel RFC 3339. À ce moment-là, Compute Engine effectue les opérations suivantes :
    • Compute Engine supprime la réservation créée automatiquement.
    • En fonction de l'action d'arrêt que vous spécifiez pour vos instances de VM, Compute Engine arrête ou supprime toutes les instances de VM que vous avez créées à l'aide de la réservation créée automatiquement.
  • Nom de la réservation : nom de la réservation que Compute Engine crée pour fournir votre capacité réservée. Compute Engine ne peut créer que des réservations spécifiquement ciblées.
  • Suppression automatique de la réservation : indique si vous souhaitez que Compute Engine supprime automatiquement la réservation créée automatiquement à la fin de la période de réservation. Si vous souhaitez supprimer manuellement la réservation, vous devez contacter votre équipe de compte.
  • Type de planification de la maintenance : façon dont Compute Engine planifie la maintenance de l'hôte pour les instances de VM de votre cluster. Spécifiez l'une des options suivantes :
    • Pour synchroniser la maintenance de toutes les VM A4X, A4 ou A3 Ultra de vos blocs réservés, utilisez GROUPED.
    • Pour utiliser des plannings de maintenance différents pour vos VM A4 ou A3 Ultra, utilisez INDEPENDENT.
    Pour les types de machines A3 Mega et A3 High, les options de planification spécialisées GROUPED et INDEPENDENT ne sont pas disponibles. Vous pouvez utiliser les Règles de maintenance des hôtes Compute Engine standards, où la maintenance est planifiée individuellement pour chaque VM plutôt que synchronisée sur l'ensemble du cluster. Étant donné que ces instances associées à des GPU ne sont pas compatibles avec la migration à chaud, elles sont soumises à une règle d'arrêt et de redémarrage.
  • Mode opérationnel de la réservation : indique si vous ou Google Cloudgérez le processus de récupération de la VM après une erreur d'hôte ou un rapport d'hôte défectueux. Le mode que vous utilisez dépend du type de machine que vous réservez :
    • Mode géré (HIGHLY_AVAILABLE_CAPACITY) : ce mode est destiné aux types de machines A4, A3 Ultra, A3 Mega et A3 High. Vous laissez Google Cloud gérer le processus de maintenance et de récupération d'une VM en remplaçant automatiquement les machines défaillantes. Cette approche augmente la disponibilité de vos VM et vous aide à les redémarrer rapidement sur de nouveaux hôtes. Toutefois, la topologie de vos VM peut changer après le remplacement d'une machine par Compute Engine.
    • Mode "Toute la capacité" (ALL_CAPACITY) : ce mode est destiné aux types de machines A4X. Vous devez gérer manuellement le processus de maintenance et de récupération d'une VM. Toutefois, vous avez un accès complet à toutes les machines de votre réservation, ainsi qu'un contrôle plus précis sur la topologie et la maintenance de vos VM.
  • Type de partage : indique si seule votre réservation peut utiliser la réservation créée automatiquement (LOCAL) ou si d'autres projets peuvent l'utiliser (SPECIFIC_PROJECTS). Cette propriété ne peut pas être modifiée après l'envoi de la demande. Pour partager la capacité réservée avec d'autres projets de votre organisation, procédez comme suit :
    1. Si ce n'est pas déjà fait, vérifiez que le projet dans lequel Google crée la demande est autorisé à créer des réservations partagées.
    2. Indiquez les numéros des projets avec lesquels partager la capacité réservée. Vous pouvez spécifier jusqu'à 100 projets dans votre organisation.
  • Nom de l'engagement : si votre période de réservation est d'un an ou plus, vous devez souscrire un engagement basé sur les ressources et l'associer à vos ressources réservées. Pour les périodes de réservation d'un an à moins de trois ans, l'engagement vous donne droit au tarif de la remise sur engagement d'utilisation (CUD) d'un an. Pour les périodes de réservation de trois à moins de six ans, l'engagement vous permet de bénéficier du taux de remise sur engagement d'utilisation de trois ans.

    Si vous partagez la capacité réservée avec d'autres projets, ceux-ci ne bénéficieront de remises que s'ils utilisent le même compte de facturation Cloud que le projet pour lequel vous réservez la capacité. Pour en savoir plus, consultez Activer le partage des remises sur engagement d'utilisation pour les engagements basés sur les ressources.

    L'engagement a les mêmes dates de début et de fin que votre réservation, mais les heures d'activation peuvent être différentes. Si vous spécifiez l'heure de début de la réservation à minuit, heure du Pacifique des États-Unis et du Canada, l'engagement devient actif à minuit à la date de début choisie. Si vous spécifiez une autre heure de début, l'engagement devient actif à minuit le lendemain de la date de début choisie.

Une fois que Google a créé le brouillon de requête de réservation future, votre équipe chargée du compte vous contacte.

Examiner et envoyer une demande de réservation brouillon

Une fois que vous avez indiqué à l'équipe chargée de votre compte le type et la quantité de ressources à réserver, Google crée un brouillon de requête de réservation future. Vous pouvez examiner la demande provisoire et, si elle est correcte, l'envoyer pour examen. Vous devez envoyer la demande avant l'heure de début de la demande.

Pour examiner et envoyer une demande de réservation future brouillon, sélectionnez l'une des options suivantes :

Console

  1. Dans la console Google Cloud , accédez à la page Réservations.

    Accéder à la page "Réservations"

  2. Cliquez sur l'onglet Réservations futures. Le tableau Réservations futures liste chaque demande de réservation future dans votre projet. Chaque colonne du tableau décrit une propriété.
  3. Dans la colonne Nom, cliquez sur le nom de la demande provisoire que Google a créée pour vous. Une page indiquant les détails de la demande de réservation future s'affiche.
  4. Dans la section Informations de base, vérifiez que les détails de la demande, tels que Dates et Type de partage, sont corrects. De plus, si vous avez demandé un engagement, vérifiez qu'il est spécifié. Si l'un de ces détails est incorrect, contactez l'équipe chargée de votre compte.
  5. Si tout vous semble correct, envoyez votre demande :

    1. Cliquez sur Modifier le brouillon. Une page permettant de modifier le brouillon de la demande s'affiche.
    2. Cliquez sur Créer. La page Réservation s'affiche. Google Cloud approuve votre demande en quelques minutes, puis Compute Engine crée une réservation vide avec les ressources que vous avez demandées.

gcloud

  1. Pour afficher la liste des demandes de réservation future dans votre projet, utilisez la commande gcloud compute future-reservations list avec l'option --filter définie sur PROCUREMENT_STATUS=DRAFTING :
    gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
    
  2. Dans le résultat de la commande, recherchez la demande de réservation portant le nom que vous avez fourni à votre équipe chargée du compte.
  3. Pour afficher les détails de la demande brouillon, utilisez la commande gcloud compute future-reservations describe :
    gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \
        --zone=ZONE
    

    Remplacez les éléments suivants :

    • FUTURE_RESERVATION_NAME : nom de la requête de réservation future brouillon.
    • ZONE : zone dans laquelle Google a créé la demande.

    Le résultat ressemble à ce qui suit :

    autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z'
    creationTimestamp: '2025-11-27T11:14:58.305-08:00'
    deploymentType: DENSE
    id: '7979651787097007552'
    kind: compute#futureReservation
    name: example-draft-request
    planningStatus: DRAFT
    reservationName: example-reservation
    schedulingType: INDEPENDENT
    selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request
    selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552
    specificReservationRequired: true
    specificSkuProperties:
      instanceProperties:
        guestAccelerators:
        -   acceleratorCount: 8
          acceleratorType: nvidia-h200-141gb
        localSsds:
        -   diskSizeGb: '375'
          interface: NVME
        ...
      machineType: a3-ultragpu-8g
    totalCount: '2'
    status:
      autoCreatedReservations:
      -   https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation
      fulfilledCount: '2'
      lockTime: '2026-01-27T19:15:00Z'
      procurementStatus: DRAFTING
    timeWindow:
      endTime: '2026-02-10T19:20:00Z'
      startTime: '2026-01-27T19:20:00Z'
    zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b
    
  4. Dans le résultat de la commande, vérifiez que les détails de la demande, tels que la période de réservation et le type de partage, sont corrects. De plus, si vous avez souscrit un engagement, vérifiez qu'il est spécifié. Si les informations sont incorrectes, contactez l'équipe chargée de votre compte.
  5. Pour envoyer la demande provisoire à des fins d'examen, utilisez la commande gcloud compute future-reservations update avec l'option --planning-status définie sur SUBMITTED :
    gcloud compute future-reservations update FUTURE_RESERVATION_NAME \
        --planning-status=SUBMITTED \
        --zone=ZONE
    

    Dans les minutes qui suivent, Google Cloud approuve votre demande, puis Compute Engine crée une réservation vide avec les ressources demandées.

REST

  1. Pour afficher la liste des demandes de réservations futures dans votre projet, envoyez une requête GET à la méthode futureReservations.list. Dans l'URL de la requête, incluez le paramètre de requête filter et définissez-le sur status.procurementStatus=DRAFTING :
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
    

    Remplacez les éléments suivants :

    • PROJECT_ID : ID du projet dans lequel Google a créé la demande de réservation future provisoire.
    • ZONE : zone où se trouve la requête.
  2. Dans le résultat de la demande, recherchez la demande de réservation dont le nom correspond à celui que vous avez fourni à votre équipe de compte.
  3. Pour afficher les détails de la demande brouillon, envoyez une requête GET à la méthode futureReservations.get bêta :
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
    

    Remplacez FUTURE_RESERVATION_NAME par le nom de la demande de réservation future à l'état "Brouillon".

    Le résultat ressemble à ce qui suit :

    {
      "specificSkuProperties": {
        "instanceProperties": {
          "machineType": "a3-ultragpu-8g",
          "guestAccelerators": [
            {
              "acceleratorType": "nvidia-h200-141gb",
              "acceleratorCount": 8
            }
          ],
          "localSsds": [
            {
              "diskSizeGb": "375",
              "interface": "NVME"
            },
            ...
          ]
        },
        "totalCount": "2"
      },
      "kind": "compute#futureReservation",
      "id": "7979651787097007552",
      "creationTimestamp": "2025-11-27T11:14:58.305-08:00",
      "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request",
      "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552",
      "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b",
      "name": "example-draft-request",
      "timeWindow": {
        "startTime": "2026-01-27T19:20:00Z",
        "endTime": "2026-02-10T19:20:00Z"
      },
      "status": {
        "procurementStatus": "DRAFTING",
        "lockTime": "2026-01-27T19:15:00Z"
      },
      "planningStatus": "DRAFT",
      "specificReservationRequired": true,
      "reservationName": "example-reservation",
      "deploymentType": "DENSE",
      "schedulingType": "INDEPENDENT",
      "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z"
    }
    
  4. Dans le résultat, vérifiez que les détails de la demande, tels que la période de réservation et le type de partage, sont corrects. De plus, si vous avez demandé un engagement, vérifiez qu'il est spécifié. Si les informations sont incorrectes, contactez l'équipe chargée de votre compte.
  5. Pour envoyer la demande brouillon pour examen, envoyez une requête PATCH à la méthode futureReservations.update bêta. Dans l'URL de la requête, incluez le paramètre de requête updateMask et définissez-le sur planningStatus :
    PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "planningStatus": "SUBMITTED"
    }
    

    Dans les minutes qui suivent, Google Cloud approuve votre demande, puis Compute Engine crée une réservation vide avec les ressources demandées.

Étapes suivantes