Utiliser une réservation
Si vous disposez d'une réservation TPU, vous pouvez utiliser vos ressources réservées pour créer des TPU correspondant aux propriétés de la réservation. Cette action est appelée utilisation d'une réservation. Pour savoir comment utiliser une réservation TPU lorsque vous utilisez GKE, consultez Réservation TPU dans la documentation GKE.
Utiliser une réservation spécifique
Lorsque vous créez des ressources avec la commande gcloud alpha compute tpus queued-resources
create
, utilisez le flag --reservation
pour spécifier le nom de la réservation à utiliser. Pour les réservations futures créées en mode Agenda, vous devez également définir le flag --provisioning-model
sur reservation-bound
:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reservation=RESERVATION_URL \ --provisioning-model=reservation-bound # Only required for calendar mode
Remplacez les variables d'espace réservé suivantes :
- QUEUED_RESOURCE_ID : ID attribué par l'utilisateur pour la demande de ressource en file d'attente.
- TPU_NAME : ID (nom) attribué par l'utilisateur au TPU créé lorsque la demande de ressource en file d'attente est allouée.
- ZONE : zone dans laquelle créer la VM TPU. Pour en savoir plus sur les zones compatibles, consultez Régions et zones.
- ACCELERATOR_TYPE : spécifie la version et la taille du Cloud TPU à créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
- SOFTWARE_VERSION : Version logicielle du Cloud TPU.
- RESERVATION_URL : URL de la réservation. Spécifiez une des valeurs suivantes :
- Si la réservation se trouve dans votre projet :
RESERVATION_NAME
- Si la réservation se trouve dans un autre projet et que votre projet peut l'utiliser :
projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME
- Si la réservation se trouve dans votre projet :
Utiliser toute réservation correspondante
Vous pouvez utiliser le flag --reserved
pour déterminer automatiquement la réservation à utiliser en fonction du type d'accélérateur, de l'ID de projet et de la zone.
CreateNode
Pour utiliser une réservation correspondante à l'aide de l'API CreateNode, exécutez la commande gcloud
alpha compute tpus tpu-vm create
avec le flag --reserved
:
gcloud alpha compute tpus tpu-vm create TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --version=SOFTWARE_VERSION \ --reserved
Remplacez les variables d'espace réservé suivantes :
- TPU_NAME : nom du TPU.
- ZONE : zone dans laquelle créer la VM TPU, qui doit correspondre à la zone de réservation.
- ACCELERATOR_TYPE : spécifie la version et la taille du Cloud TPU à créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
- SOFTWARE_VERSION : Version logicielle du Cloud TPU.
Ressources en file d'attente
Pour utiliser toute réservation correspondante à l'aide de ressources en file d'attente, utilisez la commande gcloud alpha compute tpus
queued-resources create
avec le flag --reserved
:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reserved
Remplacez les variables d'espace réservé suivantes :
- QUEUED_RESOURCE_ID : ID attribué par l'utilisateur pour la demande de ressource en file d'attente.
- TPU_NAME : ID (nom) attribué par l'utilisateur au TPU créé lorsque la demande de ressource en file d'attente est allouée.
- ZONE : zone dans laquelle créer la VM TPU et où se trouve la réservation.
- ACCELERATOR_TYPE : spécifie la version et la taille du Cloud TPU à créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
- SOFTWARE_VERSION : Version logicielle du Cloud TPU.
Vérifier l'utilisation des réservations
Vous ne pouvez vérifier l'utilisation d'une réservation partagée qu'à partir de son projet propriétaire. Si vous vous trouvez dans un projet client, vous devez passer au projet propriétaire pour vérifier l'utilisation des réservations.
Pour savoir dans quelle mesure la réservation est utilisée, exécutez la commande gcloud compute
reservations describe
:
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID --zone=ZONE
Remplacez les variables d'espace réservé suivantes :
- RESERVATION_NAME : nom de la réservation.
- PROJECT_ID : ID du projet contenant la réservation.
- ZONE : zone où se trouve la réservation.
Pour afficher la liste de toutes les réservations dans un projet, exécutez la commande gcloud compute reservations
list
:
gcloud compute reservations list --project=PROJECT_ID
Remplacez la variable d'espace réservé suivante :
- PROJECT_ID : ID du projet.
Étapes suivantes
- En savoir plus sur les réservations Cloud TPU
- Partager une réservation entre des projets
- Gérer vos TPU