Demander de la capacité de TPU en mode "Toute la capacité"

Contactez l'équipe chargée de votre compte Google Cloud pour demander une réservation en mode "Toute capacité".

Demander de la capacité de TPU en mode "Toute la capacité" avec partage de projet facultatif

Contactez l'équipe chargée de votre compte en lui fournissant les informations d'intégration requises. Votre équipe de compte créera une réservation future à l'état de brouillon que vous pourrez examiner dans la console Google Cloud .

Vous pouvez demander une réservation qui peut être partagée entre d'autres projets Google Cloudde votre organisation. Vous pouvez également demander une réservation qui peut être partagée avec un autre service Google Cloud , comme Vertex AI. Indiquez votre préférence concernant le partage des réservations dans les informations d'accueil que vous fournissez à votre équipe de compte :

Propriété Description
Numéro du projet Le numéro (et non l'ID) du projet dans lequel votre équipe chargée du compte crée la demande et Compute Engine provisionne la capacité.
Génération de TPU Trillium ou Ironwood
Zone Zone dans laquelle vous souhaitez réserver de la capacité.
Nombre de puces Nombre total de puces TPU à réserver.
Heure de début Heure de début de la période de réservation
Heure de fin Heure de fin de la période de réservation
Nom de la réservation Nom de la réservation que Compute Engine crée pour fournir votre capacité réservée
Suppression automatique des réservations Indique si vous souhaitez que Compute Engine supprime automatiquement la réservation créée automatiquement à la fin de la période de réservation. Si vous souhaitez supprimer manuellement la réservation, vous devez contacter votre équipe chargée du compte.
Type de partage Indiquez si seule votre projet peut utiliser la réservation créée automatiquement (LOCAL) ou si d'autres projets peuvent l'utiliser (SPECIFIC_PROJECTS). Vous ne pourrez pas modifier ce paramètre une fois la demande envoyée. Pour partager la capacité réservée avec d'autres projets de votre organisation, procédez comme suit :
  1. Si ce n'est pas déjà fait, vérifiez que le projet dans lequel Google crée la demande est autorisé à créer des réservations partagées.
  2. Indiquez les ID des projets avec lesquels partager la capacité réservée. Vous pouvez spécifier jusqu'à 100 projets dans votre organisation.
Nom de l'engagement Si votre période de réservation est d'un an ou plus, vous devez souscrire un engagement basé sur les ressources et l'associer à vos ressources réservées. Vous pouvez souscrire un engagement avec un forfait d'un ou trois ans. Si vous partagez la capacité réservée avec d'autres projets, ceux-ci ne bénéficieront de remises que s'ils utilisent le même compte de facturation Cloud que le projet dans lequel vous réservez la capacité. Pour en savoir plus, consultez Activer le partage des remises sur engagement d'utilisation pour les engagements basés sur les ressources.

Les propriétés suivantes sont prédéfinies pour votre réservation en mode "Toute capacité" :

Propriété Description
Type de planification de la maintenance Comment Compute Engine planifie la maintenance de l'hôte pour les VM de votre cluster. Le TPU Cluster Director n'est compatible qu'avec l'option GROUPED, ce qui signifie que la maintenance est synchronisée sur toutes les VM TPU d'un sous-bloc de votre réservation.
Mode de fonctionnement des réservations Google Cloud gère le processus de récupération de la VM après une erreur d'hôte ou un signalement d'hôte défectueux. Le TPU Cluster Director n'est compatible qu'avec l'option `ALL_CAPACITY`, ce qui signifie que vous devez gérer vous-même le processus de maintenance et de récupération d'une VM. Toutefois, vous avez un accès complet à toutes les machines de votre réservation, ainsi qu'un contrôle plus précis sur la topologie et la maintenance de vos VM.
Type de déploiement Type de déploiement de capacité. TPU Cluster Director n'est compatible qu'avec `DENSE`.

Confirmer votre brouillon de réservation de capacité

Vous devez confirmer la réservation provisoire que votre équipe de compte crée pour vous afin de recevoir la capacité du TPU Cluster Director dans votre projet Google Cloud . Suivez les instructions de la section Examiner et envoyer une demande de réservation brouillon pour confirmer la réservation.

Vérifier l'état d'une demande de capacité

Vous pouvez déterminer l'état de votre demande de capacité TPU Cluster Director. Si la demande est approuvée, la capacité est allouée à l'heure de début et pour la durée demandées. La facturation commence à l'heure de début de la réservation.

Pour en savoir plus, consultez Afficher les réservations futures.

Pour afficher les détails d'une demande de réservation future, exécutez la commande suivante à l'aide de Google Cloud CLI :

gcloud compute future-reservations describe RESERVATION_NAME \
    --zone=ZONE

Remplacez les éléments suivants :

  • RESERVATION_NAME : nom de votre demande de réservation.
  • ZONE : zone dans laquelle Google a créé la demande.

Le résultat ressemble à ce qui suit :

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'RESERVATION_NAME'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

Élargir une demande de capacité existante

Vous pouvez bénéficier d'une capacité supplémentaire grâce à une réservation existante. Lorsque de la capacité supplémentaire est ajoutée, elle hérite de toutes les propriétés de réservation, telles que les règles de partage des réservations. Vous pouvez demander un CUD avec la capacité supplémentaire. Le nouveau CUD pointera vers la même réservation. L'équipe de gestion de votre compte se chargera de la procédure d'extension de la réservation.

Afficher les détails d'une réservation depuis la console Google Cloud

Une fois votre réservation future honorée, vous pouvez la retrouver sur la page Réservations de la console Google Cloud et afficher ses détails. Une réservation de TPU avec un type de déploiement Dense indique qu'il s'agit d'une réservation de TPU Cluster Director.