Consuma una prenotazione
Se hai una prenotazione TPU, puoi utilizzare le risorse prenotate per creare TPU che corrispondono alle proprietà della prenotazione. Questa azione è nota come consumo di una prenotazione. Per informazioni sull'utilizzo di una prenotazione TPU quando utilizzi Google Kubernetes Engine (GKE), consulta Prenotazione TPU nella documentazione di GKE.
Consuma una prenotazione specifica
Quando crei risorse con il comando gcloud alpha compute tpus queued-resources
create, utilizza il flag --reservation per specificare il nome della prenotazione da utilizzare. Per le prenotazioni future
create in modalità calendario, devi impostare anche il flag --provisioning-model
su reservation-bound:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reservation=RESERVATION_URL \ --provisioning-model=reservation-bound # Only required for calendar mode
Sostituisci le seguenti variabili segnaposto:
- QUEUED_RESOURCE_ID: un ID assegnato dall'utente per la richiesta di risorse in coda.
- TPU_NAME: un ID (nome) assegnato dall'utente per la TPU creata quando viene allocata la richiesta di risorse in coda.
- ZONE: la zona in cui creare la VM TPU. Per saperne di più sulle zone supportate, consulta Regioni e zone.
- ACCELERATOR_TYPE: specifica la versione e le dimensioni della Cloud TPU da creare. Per ulteriori informazioni sui tipi di acceleratore supportati per ogni versione della TPU, consulta Versioni della TPU.
- SOFTWARE_VERSION: la versione software di Cloud TPU.
- RESERVATION_URL: l'URL della prenotazione. Specifica uno dei seguenti valori:
- Se la prenotazione si trova nel tuo progetto:
RESERVATION_NAME - Se la prenotazione si trova in un altro progetto e il tuo progetto può utilizzarla:
projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME
- Se la prenotazione si trova nel tuo progetto:
Consuma qualsiasi prenotazione corrispondente
Puoi utilizzare il flag --reserved per determinare automaticamente la prenotazione da
utilizzare in base al tipo di acceleratore, all'ID progetto e alla zona.
CreateNode
Per utilizzare qualsiasi prenotazione corrispondente utilizzando l'API CreateNode, utilizza il comando gcloud
alpha compute tpus tpu-vm create con il flag --reserved:
gcloud alpha compute tpus tpu-vm create TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --version=SOFTWARE_VERSION \ --reserved
Sostituisci le seguenti variabili segnaposto:
- TPU_NAME: un nome per la TPU.
- ZONE: la zona in cui creare la VM TPU, che deve corrispondere alla zona di prenotazione.
- ACCELERATOR_TYPE: specifica la versione e le dimensioni della Cloud TPU da creare. Per ulteriori informazioni sui tipi di acceleratore supportati per ogni versione della TPU, consulta Versioni della TPU.
- SOFTWARE_VERSION: la versione software di Cloud TPU.
Risorse in coda
Per utilizzare qualsiasi prenotazione corrispondente utilizzando le risorse in coda, utilizza il comando gcloud alpha compute tpus
queued-resources create con il flag --reserved:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reserved
Sostituisci le seguenti variabili segnaposto:
- QUEUED_RESOURCE_ID: un ID assegnato dall'utente per la richiesta di risorse in coda.
- TPU_NAME: un ID (nome) assegnato dall'utente per la TPU creata quando viene allocata la richiesta di risorse in coda.
- ZONE: la zona in cui creare la VM TPU e in cui esiste la prenotazione.
- ACCELERATOR_TYPE: specifica la versione e le dimensioni della Cloud TPU da creare. Per ulteriori informazioni sui tipi di acceleratore supportati per ogni versione della TPU, consulta Versioni della TPU.
- SOFTWARE_VERSION: la versione software di Cloud TPU.
Controllare l'utilizzo della prenotazione
Puoi controllare l'utilizzo di una prenotazione condivisa solo dal progetto proprietario. Se ti trovi in un progetto consumer, devi passare al progetto proprietario per controllare l'utilizzo della prenotazione.
Per vedere quanto della prenotazione è in uso, utilizza il comando gcloud compute
reservations describe:
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID --zone=ZONE
Sostituisci le seguenti variabili segnaposto:
- RESERVATION_NAME: il nome della prenotazione.
- PROJECT_ID: l'ID del progetto che contiene la prenotazione.
- ZONE: la zona in cui esiste la prenotazione.
Per elencare tutte le prenotazioni in un progetto, utilizza il comando gcloud compute reservations
list:
gcloud compute reservations list --project=PROJECT_ID
Sostituisci la seguente variabile segnaposto:
- PROJECT_ID: l'ID del progetto.