Demander de la capacité TPU en mode "Toute la capacité"
Contactez l'équipe chargée de votre Google Cloud compte pour demander une réservation en mode "Toute la capacité" .
Demander de la capacité TPU en mode "Toute la capacité" avec partage de projet facultatif
Contactez l'équipe chargée de votre compte et fournissez les informations d'ingestion requises. L'équipe chargée de votre compte créera une réservation future à l'état de brouillon que vous pourrez examiner dans la Google Cloud console.
Vous pouvez demander une réservation qui peut être partagée entre d'autres Google Cloud projets de votre organisation. Vous pouvez également demander une réservation qui peut être partagée avec un autre Google Cloud service, comme Vertex AI. Indiquez votre préférence de partage de réservation dans les informations d'ingestion que vous fournissez à l'équipe chargée de votre compte :
| Propriété | Description |
|---|---|
| Numéro du projet | Le numéro (et non ID) du projet dans lequel l'équipe chargée de votre compte crée la requête et Compute Engine provisionne la capacité. |
| Génération de TPU | Trillium ou Ironwood |
| Zone | Zone dans laquelle vous souhaitez réserver de la capacité. |
| Nombre de puces | Nombre total de puces TPU à réserver. |
| Heure de début | Heure de début de la période de réservation |
| Heure de fin | Heure de fin de la période de réservation |
| Nom de la réservation | Nom de la réservation que Compute Engine crée pour fournir votre capacité réservée |
| Suppression automatique de la réservation | Indiquez si vous souhaitez que Compute Engine supprime automatiquement la réservation créée automatiquement à la fin de la période de réservation. Si vous souhaitez supprimer manuellement la réservation, vous devez contacter l'équipe chargée de votre compte. |
| Type de partage | Indiquez si seul votre projet peut utiliser la réservation créée automatiquement (LOCAL),
ou si d'autres projets peuvent l'utiliser (SPECIFIC_PROJECTS). Vous ne pouvez pas
modifier ce paramètre après avoir envoyé la requête. Pour partager la capacité réservée
avec d'autres projets de votre organisation, procédez comme suit :
|
| Nom de l'engagement | Si votre période de réservation est d'un an ou plus, vous devez acheter et associer un engagement basé sur les ressources à vos ressources réservées. Vous pouvez acheter un engagement avec un forfait d'un ou trois ans. Si vous partagez la capacité réservée avec d'autres projets, ces projets ne bénéficient de remises que s'ils utilisent le même compte de facturation Cloud que le projet dans lequel vous réservez de la capacité. Pour en savoir plus, consultez Activer le partage des remises sur engagement d'utilisation pour les engagements basés sur les ressources. |
Les propriétés suivantes sont prédéfinies pour votre réservation en mode "Toute la capacité" :
| Propriété | Description |
|---|---|
| Type de planification de la maintenance | Indique comment Compute Engine planifie la maintenance de l'hôte pour les VM de votre
cluster. TPU Cluster Director n'est compatible qu'avec l'option GROUPED, ce qui
signifie que la maintenance est synchronisée sur toutes les VM TPU d'un sous-bloc de
votre réservation. |
| Mode de fonctionnement de la réservation | Indique comment Google Cloud gère le processus de récupération de la VM après une erreur d'hôte ou un rapport d'hôte défectueux. TPU Cluster Director n'est compatible qu'avec l'option `ALL_CAPACITY`, ce qui signifie que vous devez gérer vous-même le processus de maintenance et de récupération d'une VM. Toutefois, vous disposez d'un accès complet à toutes les machines de votre réservation, ainsi que d'un contrôle plus précis sur la topologie et la maintenance de votre VM. |
| Type de déploiement | Type de déploiement de la capacité. TPU Cluster Director n'est compatible qu'avec `DENSE`. |
Confirmer votre brouillon de réservation de capacité
Vous devez confirmer le brouillon de réservation que l'équipe chargée de votre compte crée pour vous en afin de recevoir la capacité de TPU Cluster Director dans votre Google Cloud projet. Suivez les instructions de la section Examiner et envoyer une demande de réservation brouillon pour confirmer la réservation.
Vérifier l'état d'une demande de capacité
Vous pouvez déterminer l'état de votre demande de capacité TPU Cluster Director. Si la demande est approuvée, la capacité est allouée à l'heure de début demandée pour la durée demandée. La facturation commence à l'heure de début de la réservation.
Pour en savoir plus, consultez Afficher les réservations futures.
Pour afficher les détails d'une demande de réservation future, exécutez la commande suivante à l'aide de Google Cloud CLI :
gcloud compute future-reservations describe RESERVATION_NAME \ --zone=ZONE
Remplacez les éléments suivants :
- RESERVATION_NAME : nom de votre demande de réservation.
- ZONE : zone dans laquelle Google a créé la requête.
Le résultat ressemble à ce qui suit :
creationTimestamp: '2025-04-01' kind: compute#FutureReservation name: 'RESERVATION_NAME' aggregateReservations: vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L status: lockTime: 2024-03-01T17:00:00Z procurementStatus: APPROVED timeWindow: endTime: 2025-06-01T17:00:00Z startTime: 2024-05-01T17:00:00Z ...
Étendre une demande de capacité existante
Vous pouvez recevoir une capacité supplémentaire via une réservation existante. Lorsque vous ajoutez de la capacité, elle hérite de toutes les propriétés de la réservation, telles que les règles de partage de la réservation. Vous pouvez demander une remise sur engagement d'utilisation avec la capacité supplémentaire. La nouvelle remise sur engagement d'utilisation pointera vers la même réservation. L'équipe chargée de votre compte effectuera le processus d'extension de la réservation pour vous.
Afficher les détails de la réservation dans la Google Cloud console
Une fois votre réservation future effectuée, vous pouvez la trouver sur la Google Cloud console
page Réservation
et afficher ses détails. Une réservation de TPU avec un type de déploiement Dense indique qu'il s'agit d'une réservation TPU Cluster Director.