Crea VM TPU con inizio flessibile con Compute Engine
Le VM TPU con inizio flessibile, con piattaforma Dynamic Workload Scheduler, offrono un modo flessibile ed economico per accedere alle risorse TPU per i workload di AI per un massimo di 7 giorni senza prenotazioni a lungo termine. Quando richiedi VM TPU con inizio flessibile, la richiesta rimane in una coda finché non è disponibile la capacità. Una volta eseguito il provisioning, le VM TPU vengono eseguite per la durata specificata.
Le VM TPU con inizio flessibile sono adatte per sperimentazioni rapide, test su piccola scala, provisioning dinamico di TPU per workload di inferenza, ottimizzazione dei modelli ed esecuzioni di workload che richiedono meno di 7 giorni. Per saperne di più sulle altre opzioni di consumo di TPU, consulta Opzioni di consumo di Cloud TPU.
Puoi eliminare le risorse TPU in qualsiasi momento per interrompere la fatturazione. Per saperne di più sui prezzi delle TPU, consulta Prezzi di Cloud TPU pricing.
Limitazioni
Le VM TPU con inizio flessibile presentano le seguenti limitazioni:
- Puoi richiedere VM TPU con inizio flessibile per una durata massima di 7 giorni.
- Puoi richiedere le seguenti versioni e zone di Cloud TPU:
I MIG con TPU presentano le seguenti limitazioni:
Operazioni del ciclo di vita: non puoi arrestare, avviare, riprendere o sospendere le istanze TPU. Per modificare le configurazioni che richiedono un riavvio o per interrompere l'addebito, devi eliminare le istanze.
Distribuzione delle zone MIG a livello di regione: devi impostare la forma di distribuzione target su
ANY_SINGLE_ZONE.Aggiornamenti della configurazione in un MIG:
- Non puoi aggiornare un MIG che forma una sezione TPU multi-host a causa della topologia dell'acceleratore definita.
- Puoi aggiornare un MIG che forma sezioni TPU single-host utilizzando i
metodi automatici o selettivi.
Tuttavia, gli aggiornamenti per la sezione TPU single-host non supportano l'azione di riavvio (
RESTART). Se è necessario un riavvio e l'azione più invasiva consentita è la sostituzione (REPLACE), il programma di aggiornamento sostituirà l'istanza; in caso contrario, il tentativo di aggiornamento non riuscirà e verrà generato un errore.
Per un MIG che forma una sezione TPU multi-host, si applicano anche le seguenti limitazioni:
Policy della dimensione target: devi impostare la modalità della policy della dimensione target su
BULK. Dopo aver impostato questa modalità, non puoi modificarla.Dimensione target: in modalità in blocco, puoi impostare la dimensione target su
0o il numero di istanze necessarie per formare la topologia dell'acceleratore.Policy del workload: devi specificare una policy del workload in cui è definita la topologia dell'acceleratore. Dopo aver impostato la policy del workload, non puoi modificarla o rimuoverla dal MIG.
Funzionalità non supportate: i MIG con TPU non supportano le seguenti funzionalità:
- Flessibilità istanza
- Richieste di ridimensionamento per ottenere le risorse tutte insieme
- Configurazione stateful
- Per un MIG che forma una sezione TPU multi-host, non sono supportati anche:
Prima di iniziare
Prima di richiedere VM TPU con inizio flessibile, devi:
- Installa Google Cloud CLI
- Crea un Google Cloud progetto
- Abilita l'API Compute Engine (
compute.googleapis.com) - Assicurati di disporre delle autorizzazioni richieste:
roles/compute.instanceAdmin.v1roles/iam.serviceAccountUser
Per saperne di più, consulta Configura un Google Cloud progetto per le TPU.
Assicurati di avere una quota preemptible sufficiente per utilizzare le VM TPU con inizio flessibile. Se il tuo workload richiede più core rispetto all'allocazione attuale, puoi richiedere un aumento della quota. Per informazioni dettagliate, consulta Quote di Cloud TPU.
Crea VM TPU con inizio flessibile con i MIG
Per utilizzare le VM TPU con inizio flessibile, devi creare un gruppo di istanze gestite (MIG) con una configurazione specifica del modello di istanza.
Per istruzioni generali sulla creazione di VM con inizio flessibile, consulta Crea VM con inizio flessibile.
Crea VM TPU con inizio flessibile con una sezione multi-host
Crea un modello di istanza
Crea un modello di istanza specificando il modello di provisioning FLEX_START e la durata di esecuzione scelta.
gcloud compute instance-templates create TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--provisioning-model=FLEX_START \
--instance-termination-action=DELETE \
--max-run-duration=DURATION \
--region=REGION \
--maintenance-policy=TERMINATE
Sostituisci i seguenti segnaposto:
- TEMPLATE_NAME: il nome del modello di istanza.
- MACHINE_TYPE: il tipo di macchina
per la VM TPU (ad esempio,
ct6e-standard-8t). - IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU (per
esempio,
ubuntu-accelerator-2204-amd64-with-tpu-v6e) - IMAGE_PROJECT: il progetto immagine del sistema operativo per la VM TPU
(ad esempio,
ubuntu-os-accelerator-images) - DURATION: la durata massima di esecuzione (ad esempio,
7dper 7 giorni). - REGION: la regione in cui creare il template di istanza.
Crea una policy del workload
Il seguente comando crea una policy del workload. Questa operazione è facoltativa per le sezioni single-host.
gcloud compute resource-policies create workload WORKLOAD_POLICY_NAME \
--type=high-throughput \
--accelerator-topology=TOPOLOGY
Sostituisci i seguenti segnaposto:
- WORKLOAD_POLICY_NAME: il nome della policy del workload.
- TOPOLOGY: la topologia delle VM TPU, ad esempio
4x4x8.
Crea il MIG
Crea il MIG utilizzando il modello.
gcloud compute instance-groups managed create MIG_NAME \
--zone=ZONE \
--template=TEMPLATE_NAME \
--size=SIZE \
--workload-policy=projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME \
--target-size-policy-mode=bulk
Sostituisci i seguenti segnaposto:
- MIG_NAME: il nome del MIG.
- ZONE: la zona del MIG.
- TEMPLATE_NAME: il nome del modello di istanza.
- SIZE: il numero di istanze da creare.
- PROJECT_ID: l'ID del Google Cloud progetto.
- WORKLOAD_POLICY_REGION: la regione in cui è definita la policy del workload.
- WORKLOAD_POLICY_NAME: il nome della policy del workload.
Crea VM TPU con inizio flessibile con sezioni single-host
Crea un modello di istanza
Crea un modello di istanza specificando il modello di provisioning FLEX_START e la durata di esecuzione scelta.
gcloud compute instance-templates create TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--provisioning-model=FLEX_START \
--instance-termination-action=DELETE \
--max-run-duration=DURATION \
--region=REGION \
--maintenance-policy=TERMINATE
Sostituisci i seguenti segnaposto:
- TEMPLATE_NAME: il nome del modello di istanza.
- MACHINE_TYPE: il tipo di macchina
per la VM TPU (ad esempio,
ct6e-standard-8t). - IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU (per
esempio,
ubuntu-accelerator-2204-amd64-with-tpu-v6e) - IMAGE_PROJECT: il progetto immagine del sistema operativo per la VM TPU (ad
esempio,
ubuntu-os-accelerator-images) - DURATION: la durata massima di esecuzione (ad esempio,
7dper 7 giorni). - REGION: la regione in cui creare il template di istanza.
Crea una policy del workload
Il seguente comando crea una policy del workload. Questa operazione è facoltativa per le sezioni single-host.
gcloud compute resource-policies create workload WORKLOAD_POLICY_NAME \
--type=high-throughput
Sostituisci i seguenti segnaposto:
- WORKLOAD_POLICY_NAME: un nome per la policy del workload.
Crea il MIG
Crea il MIG utilizzando il modello.
gcloud compute instance-groups managed create MIG_NAME \
--zone=ZONE \
--template=TEMPLATE_NAME \
--size=SIZE \
--workload-policy=projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME
Sostituisci i seguenti segnaposto:
- MIG_NAME: il nome del MIG.
- ZONE: la zona del MIG.
- TEMPLATE_NAME: il nome del modello di istanza.
- SIZE: il numero di istanze da creare.
- PROJECT_ID: l'ID del Google Cloud progetto.
- WORKLOAD_POLICY_REGION: la regione in cui è definita la policy del workload.
- WORKLOAD_POLICY_NAME: il nome della policy del workload.