Utiliser une réservation

Si vous disposez d'une réservation TPU, vous pouvez utiliser vos ressources réservées pour créer des TPU correspondant aux propriétés de la réservation. Cette action est appelée utilisation d'une réservation. Pour savoir comment utiliser une réservation TPU lorsque vous utilisez GKE, consultez Réservation TPU dans la documentation GKE.

Utiliser une réservation spécifique

Lorsque vous créez des ressources avec la commande gcloud alpha compute tpus queued-resources create, utilisez le flag --reservation pour spécifier le nom de la réservation à utiliser. Pour les réservations futures créées en mode Agenda, vous devez également définir le flag --provisioning-model sur reservation-bound :

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

Remplacez les variables d'espace réservé suivantes :

  • QUEUED_RESOURCE_ID : ID attribué par l'utilisateur pour la demande de ressource en file d'attente.
  • TPU_NAME : ID (nom) attribué par l'utilisateur au TPU créé lorsque la demande de ressource en file d'attente est allouée.
  • ZONE : zone dans laquelle créer la VM TPU. Pour en savoir plus sur les zones compatibles, consultez Régions et zones.
  • ACCELERATOR_TYPE : spécifie la version et la taille du Cloud TPU à créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
  • SOFTWARE_VERSION : Version logicielle du Cloud TPU.
  • RESERVATION_URL : URL de la réservation. Spécifiez une des valeurs suivantes :
    • Si la réservation se trouve dans votre projet : RESERVATION_NAME
    • Si la réservation se trouve dans un autre projet et que votre projet peut l'utiliser : projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

Utiliser toute réservation correspondante

Vous pouvez utiliser le flag --reserved pour déterminer automatiquement la réservation à utiliser en fonction du type d'accélérateur, de l'ID de projet et de la zone.

CreateNode

Pour utiliser une réservation correspondante à l'aide de l'API CreateNode, exécutez la commande gcloud alpha compute tpus tpu-vm create avec le flag --reserved :

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

Remplacez les variables d'espace réservé suivantes :

  • TPU_NAME : nom du TPU.
  • ZONE : zone dans laquelle créer la VM TPU, qui doit correspondre à la zone de réservation.
  • ACCELERATOR_TYPE : spécifie la version et la taille du Cloud TPU à créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
  • SOFTWARE_VERSION : Version logicielle du Cloud TPU.

Ressources en file d'attente

Pour utiliser toute réservation correspondante à l'aide de ressources en file d'attente, utilisez la commande gcloud alpha compute tpus queued-resources create avec le flag --reserved :

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

Remplacez les variables d'espace réservé suivantes :

  • QUEUED_RESOURCE_ID : ID attribué par l'utilisateur pour la demande de ressource en file d'attente.
  • TPU_NAME : ID (nom) attribué par l'utilisateur au TPU créé lorsque la demande de ressource en file d'attente est allouée.
  • ZONE : zone dans laquelle créer la VM TPU et où se trouve la réservation.
  • ACCELERATOR_TYPE : spécifie la version et la taille du Cloud TPU à créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
  • SOFTWARE_VERSION : Version logicielle du Cloud TPU.

Vérifier l'utilisation des réservations

Vous ne pouvez vérifier l'utilisation d'une réservation partagée qu'à partir de son projet propriétaire. Si vous vous trouvez dans un projet client, vous devez passer au projet propriétaire pour vérifier l'utilisation des réservations.

Pour savoir dans quelle mesure la réservation est utilisée, exécutez la commande gcloud compute reservations describe :

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

Remplacez les variables d'espace réservé suivantes :

  • RESERVATION_NAME : nom de la réservation.
  • PROJECT_ID : ID du projet contenant la réservation.
  • ZONE : zone où se trouve la réservation.

Pour afficher la liste de toutes les réservations dans un projet, exécutez la commande gcloud compute reservations list :

gcloud compute reservations list --project=PROJECT_ID

Remplacez la variable d'espace réservé suivante :

  • PROJECT_ID : ID du projet.

Étapes suivantes