Consuma una prenotazione

Se hai una prenotazione TPU, puoi utilizzare le risorse riservate per creare TPU che corrispondono alle proprietà della prenotazione. Questa azione è nota come utilizzo di una prenotazione. Per informazioni sull'utilizzo di una prenotazione TPU quando utilizzi Google Kubernetes Engine (GKE), consulta Prenotazione TPU nella documentazione di GKE.

La modalità di utilizzo di una prenotazione dipende da come crei le VM TPU. Puoi creare istanze VM TPU o un MIG con TPU.

Utilizza una prenotazione durante la creazione di una VM TPU

Quando crei un'istanza VM TPU, specifica la prenotazione da utilizzare utilizzando i --reservation-affinity e --reservation parametri:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --reservation-affinity=specific \
    --reservation=projects/PROJECT_ID/reservations/RESERVATION_NAME \
    --provisioning-model=reservation-bound \
    --maintenance-policy=TERMINATE

Sostituisci i seguenti segnaposto:

  • TPU_NAME: il nome della VM TPU.
  • MACHINE_TYPE: il tipo di macchina per la VM TPU (ad esempio ct6e-standard-8t).
  • IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag --image. Per saperne di più sulle immagini del sistema operativo, consulta Immagini del sistema operativo.
  • IMAGE_PROJECT: il progetto che contiene l'immagine del sistema operativo. Per le immagini TPU, questo è ubuntu-os-accelerator-images.
  • ZONE: la zona per la VM TPU (ad esempio us-central1-b).
  • PROJECT_ID: l'ID del progetto per il quale è stata effettuata la prenotazione.
  • RESERVATION_NAME: il nome della prenotazione nel formato projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME.

Utilizza una prenotazione durante la creazione di un MIG

Esistono due tipi di MIG che puoi creare con le VM TPU:

  • MIG con sezioni a singolo host.
  • MIG con una sezione multi-host.

Utilizza una prenotazione quando crei un MIG con sezioni a singolo host

Per utilizzare una prenotazione quando crei un MIG con sezioni a singolo host, devi specificare la prenotazione come parte del template di istanza.

Per creare un MIG con sezioni a singolo host:

  1. Crea template di istanza
  2. (Facoltativo) Crea una policy del workload
  3. Crea un MIG

Crea un template di istanza che utilizzi una prenotazione

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
     --machine-type=MACHINE_TYPE \
     --maintenance-policy=TERMINATE \
     --instance-termination-action=DELETE \
     --reservation-affinity=specific \
     --provisioning-model=reservation-bound \
     --reservation=RESERVATION_NAME \
     --image-family=IMAGE_FAMILY \
     --image-project=IMAGE_PROJECT

Sostituisci i seguenti segnaposto:

  • INSTANCE_TEMPLATE_NAME: il nome del template di istanza.
  • MACHINE_TYPE: il tipo di macchina per la VM TPU (per esempio, ct6e-standard-8t).
  • RESERVATION_NAME: il nome della prenotazione nel formato projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME.
  • IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag --image. Per saperne di più sulle immagini del sistema operativo, consulta Immagini del sistema operativo.
  • IMAGE_PROJECT: il progetto che contiene l'immagine del sistema operativo. Per le immagini TPU, questo è ubuntu-os-accelerator-images.

Crea il MIG

Puoi creare un MIG a livello di zona o un MIG a livello di regione.

Crea un MIG a livello di zona
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --template=INSTANCE_TEMPLATE_NAME \
    --zone=ZONE

Sostituisci i seguenti segnaposto:

  • MIG_NAME: il nome del MIG.
  • SIZE: il numero di VM TPU nel MIG.
  • INSTANCE_TEMPLATE_NAME: il nome del template di istanza.
  • ZONE: la zona in cui vuoi che venga eseguito il provisioning del MIG.
Crea un MIG a livello di regione
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --template=INSTANCE_TEMPLATE_NAME\
    --region=REGION \
    --target-distribution-shape=any

Sostituisci i seguenti segnaposto:

  • MIG_NAME: il nome del MIG.
  • SIZE: il numero di VM TPU nel MIG.
  • INSTANCE_TEMPLATE_NAME: il nome del template di istanza.
  • REGION: la zona in cui vuoi che venga eseguito il provisioning del MIG.

Per saperne di più sul flag --target-distribution-shape, consulta Imposta una forma di distribuzione di destinazione per le VM in un MIG a livello di regione.

Utilizza una prenotazione quando crei un MIG con una sezione multi-host

Per utilizzare una prenotazione quando crei un MIG con una sezione multi-host, devi specificare la prenotazione come parte del template di istanza.

Crea un template di istanza che utilizzi una prenotazione

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
     --machine-type=MACHINE_TYPE \
     --maintenance-policy=TERMINATE \
     --instance-termination-action=DELETE \
     --reservation-affinity=specific \
     --provisioning-model=reservation-bound \
     --reservation=RESERVATION_NAME \
     --image-family=IMAGE_FAMILY \
     --image-project=IMAGE_PROJECT

Sostituisci i seguenti segnaposto:

  • INSTANCE_TEMPLATE_NAME: il nome del template di istanza.
  • MACHINE_TYPE: il tipo di macchina per la VM TPU (per esempio, ct6e-standard-8t).
  • RESERVATION_NAME: il nome della prenotazione nel formato projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME.
  • IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag --image. Per saperne di più sulle immagini del sistema operativo, consulta Immagini del sistema operativo.
  • IMAGE_PROJECT: il progetto che contiene l'immagine del sistema operativo. Per le immagini TPU, questo è ubuntu-os-accelerator-images.

Crea una policy del workload

Puoi specificare una policy del workload per i tuoi MIG. Per saperne di più, consulta Policy del workload per i MIG.

gcloud compute resource-policies create workload WORKLOAD_POLICY_NAME \
  --type=high-throughput \
  --accelerator-topology=TOPOLOGY

Sostituisci i seguenti segnaposto:

  • WORKLOAD_POLICY_NAME: un nome per la policy del workload.
  • TOPOLOGY: la topologia delle VM TPU, ad esempio 4x4x8. Per saperne di più sulla topologia di ogni versione di TPU, consulta Versioni di TPU.

Crea il MIG

Puoi creare un MIG a livello di zona o un MIG a livello di regione.

Crea un MIG a livello di zona
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --target-size-policy-mode=bulk \
    --default-action-on-vm-failure=do-nothing \
    --template=INSTANCE_TEMPLATE_URL \
    --zone=ZONE \
    --workload-policy=WORKLOAD_POLICY_URL

Sostituisci i seguenti segnaposto:

  • MIG_NAME: il nome del MIG.
  • SIZE: il numero di VM TPU nel MIG.
  • INSTANCE_TEMPLATE_URL: l'URL del template di istanza che vuoi utilizzare per creare istanze nel MIG. L'URL può contenere l' ID o il nome del template di istanza. Specifica uno dei seguenti valori:
    • Per un template di istanza regionale: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • Per un template di istanza globale: INSTANCE_TEMPLATE_ID
  • ZONE: la zona in cui vuoi che venga eseguito il provisioning del MIG.
  • WORKLOAD_POLICY_URL: l'URL della policy del workload che vuoi utilizzare per creare istanze nel MIG. Ad esempio: projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME
Crea un MIG a livello di regione
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --target-size-policy-mode=bulk \
    --default-action-on-vm-failure=do-nothing \
    --template=INSTANCE_TEMPLATE_URL \
    --zone=ZONE \
    --target-distribution-shape=any-single-zone \
    --instance-redistribution-type=none \
    --workload-policy=WORKLOAD_POLICY_URL

Sostituisci i seguenti segnaposto:

  • MIG_NAME: il nome del MIG.
  • SIZE: il numero di VM TPU nel MIG.
  • INSTANCE_TEMPLATE_URL: l'URL del template di istanza che vuoi utilizzare per creare istanze nel MIG. L'URL può contenere l' ID o il nome del template di istanza. Specifica uno dei seguenti valori:
    • Per un template di istanza regionale: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • Per un template di istanza globale: INSTANCE_TEMPLATE_ID
  • ZONE: la zona in cui vuoi che venga eseguito il provisioning del MIG.
  • WORKLOAD_POLICY_URL: l'URL della policy del workload che vuoi utilizzare per creare istanze nel MIG. Ad esempio: projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME

Controlla l'utilizzo della prenotazione

Puoi controllare l'utilizzo della prenotazione condivisa solo dal progetto proprietario. Se ti trovi in un progetto consumer, devi passare al progetto proprietario per controllare l'utilizzo della prenotazione.

Per vedere la quantità di prenotazione in uso, utilizza il gcloud compute reservations describe comando:

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

Sostituisci le seguenti variabili segnaposto:

  • RESERVATION_NAME: il nome della prenotazione.
  • PROJECT_ID: l'ID del progetto che contiene la prenotazione.
  • ZONE: la zona in cui esiste la prenotazione.

Per elencare tutte le prenotazioni in un progetto, utilizza il gcloud compute reservations list comando:

gcloud compute reservations list --project=PROJECT_ID

Sostituisci la seguente variabile segnaposto:

  • PROJECT_ID: l'ID del progetto.

Passaggi successivi