Demander de la capacité de TPU en mode "Toute la capacité"
Contactez l'équipe chargée de votre compte Google Cloud pour demander une réservation en mode "Toute capacité".
Demander de la capacité de TPU en mode "Toute la capacité" avec partage de projet facultatif
Contactez l'équipe chargée de votre compte en lui fournissant les informations d'intégration requises. Votre équipe de compte créera une réservation future à l'état de brouillon que vous pourrez examiner dans la console Google Cloud .
Vous pouvez demander une réservation qui peut être partagée entre d'autres projets Google Cloudde votre organisation. Vous pouvez également demander une réservation qui peut être partagée avec un autre service Google Cloud , comme Vertex AI. Indiquez votre préférence concernant le partage des réservations dans les informations d'accueil que vous fournissez à votre équipe de compte :
| Propriété | Description |
|---|---|
| Numéro du projet | Le numéro (et non l'ID) du projet dans lequel votre équipe chargée du compte crée la demande et Compute Engine provisionne la capacité. |
| Génération de TPU | Trillium ou Ironwood |
| Zone | Zone dans laquelle vous souhaitez réserver de la capacité. |
| Nombre de puces | Nombre total de puces TPU à réserver. |
| Heure de début | Heure de début de la période de réservation |
| Heure de fin | Heure de fin de la période de réservation |
| Nom de la réservation | Nom de la réservation que Compute Engine crée pour fournir votre capacité réservée |
| Suppression automatique des réservations | Indique si vous souhaitez que Compute Engine supprime automatiquement la réservation créée automatiquement à la fin de la période de réservation. Si vous souhaitez supprimer manuellement la réservation, vous devez contacter votre équipe chargée du compte. |
| Type de partage | Indiquez si seule votre projet peut utiliser la réservation créée automatiquement (LOCAL) ou si d'autres projets peuvent l'utiliser (SPECIFIC_PROJECTS). Vous ne pourrez pas modifier ce paramètre une fois la demande envoyée. Pour partager la capacité réservée avec d'autres projets de votre organisation, procédez comme suit :
|
| Nom de l'engagement | Si votre période de réservation est d'un an ou plus, vous devez souscrire un engagement basé sur les ressources et l'associer à vos ressources réservées. Vous pouvez souscrire un engagement avec un forfait d'un ou trois ans. Si vous partagez la capacité réservée avec d'autres projets, ceux-ci ne bénéficieront de remises que s'ils utilisent le même compte de facturation Cloud que le projet dans lequel vous réservez la capacité. Pour en savoir plus, consultez Activer le partage des remises sur engagement d'utilisation pour les engagements basés sur les ressources. |
Les propriétés suivantes sont prédéfinies pour votre réservation en mode "Toute capacité" :
| Propriété | Description |
|---|---|
| Type de planification de la maintenance | Comment Compute Engine planifie la maintenance de l'hôte pour les VM de votre cluster. Le TPU Cluster Director n'est compatible qu'avec l'option GROUPED, ce qui signifie que la maintenance est synchronisée sur toutes les VM TPU d'un sous-bloc de votre réservation. |
| Mode de fonctionnement des réservations | Google Cloud gère le processus de récupération de la VM après une erreur d'hôte ou un signalement d'hôte défectueux. Le TPU Cluster Director n'est compatible qu'avec l'option `ALL_CAPACITY`, ce qui signifie que vous devez gérer vous-même le processus de maintenance et de récupération d'une VM. Toutefois, vous avez un accès complet à toutes les machines de votre réservation, ainsi qu'un contrôle plus précis sur la topologie et la maintenance de vos VM. |
| Type de déploiement | Type de déploiement de capacité. TPU Cluster Director n'est compatible qu'avec `DENSE`. |
Confirmer votre brouillon de réservation de capacité
Vous devez confirmer la réservation provisoire que votre équipe de compte crée pour vous afin de recevoir la capacité du TPU Cluster Director dans votre projet Google Cloud . Suivez les instructions de la section Examiner et envoyer une demande de réservation brouillon pour confirmer la réservation.
Vérifier l'état d'une demande de capacité
Vous pouvez déterminer l'état de votre demande de capacité TPU Cluster Director. Si la demande est approuvée, la capacité est allouée à l'heure de début et pour la durée demandées. La facturation commence à l'heure de début de la réservation.
Pour en savoir plus, consultez Afficher les réservations futures.
Pour afficher les détails d'une demande de réservation future, exécutez la commande suivante à l'aide de Google Cloud CLI :
gcloud compute future-reservations describe RESERVATION_NAME \ --zone=ZONE
Remplacez les éléments suivants :
- RESERVATION_NAME : nom de votre demande de réservation.
- ZONE : zone dans laquelle Google a créé la demande.
Le résultat ressemble à ce qui suit :
creationTimestamp: '2025-04-01' kind: compute#FutureReservation name: 'RESERVATION_NAME' aggregateReservations: vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L status: lockTime: 2024-03-01T17:00:00Z procurementStatus: APPROVED timeWindow: endTime: 2025-06-01T17:00:00Z startTime: 2024-05-01T17:00:00Z ...
Élargir une demande de capacité existante
Vous pouvez bénéficier d'une capacité supplémentaire grâce à une réservation existante. Lorsque de la capacité supplémentaire est ajoutée, elle hérite de toutes les propriétés de réservation, telles que les règles de partage des réservations. Vous pouvez demander un CUD avec la capacité supplémentaire. Le nouveau CUD pointera vers la même réservation. L'équipe de gestion de votre compte se chargera de la procédure d'extension de la réservation.
Afficher les détails d'une réservation depuis la console Google Cloud
Une fois votre réservation future honorée, vous pouvez la retrouver sur la page Réservations de la console Google Cloud et afficher ses détails. Une réservation de TPU avec un type de déploiement Dense indique qu'il s'agit d'une réservation de TPU Cluster Director.