Questo documento descrive come creare un'istanza di macchina virtuale (VM) TPU. Una VM TPU è chiamata anche slice TPU a host singolo.
Per creare un gruppo di sezioni single-host, consulta Crea un MIG con sezioni TPU single-host.
Prima di iniziare
-
Se non l'hai ancora fatto, configura l'autenticazione.
L'autenticazione verifica la tua identità per l'accesso ad API e servizi Google Cloud . Per eseguire
codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su
Compute Engine selezionando una delle seguenti opzioni:
-
Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:
gcloud initSe utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
- Imposta una regione e una zona predefinite.
-
Prerequisiti
Prima di procedere alla creazione di un'istanza TPU, devi:
Scegli la versione TPU: seleziona la versione TPU adatta al tuo workload. Per un elenco delle versioni TPU per tipo di workload, consulta Versioni TPU consigliate per tipo di workload.
Verifica la disponibilità di TPU nella tua località preferita: le TPU sono disponibili in regioni Google Cloud specifiche. Per utilizzare una versione della TPU, assicurati che sia disponibile nella regione che preferisci. Per un elenco delle località TPU, consulta Disponibilità delle TPU.
Assicurati che il tuo progetto disponga di una quota TPU sufficiente: se stai creando un'istanza TPU con VM on demand o spot, devi disporre di una quota TPU sufficiente disponibile nella regione che vuoi utilizzare. La creazione di un'istanza TPU che utilizza una prenotazione TPU non richiede alcuna quota TPU, in quanto la quota viene utilizzata al momento della creazione della prenotazione. Per un elenco dei nomi delle quote TPU, consulta Quota TPU e per istruzioni su come visualizzare la quota, consulta Visualizza e gestisci le quote.
Scegli un'opzione di consumo TPU: seleziona un'opzione di consumo più adatta al tuo workload, alla sua durata e alle tue esigenze di costo. Per un elenco delle opzioni di consumo disponibili per versione TPU, consulta Opzioni di consumo TPU.
Crea un'istanza VM TPU
I parametri che utilizzi per creare un'istanza VM TPU dipendono dall'opzione di consumo che utilizzi: on demand, spot, con prenotazione o con avvio flessibile. Per maggiori informazioni, vedi Informazioni sui modelli di provisioning delle VM .
Crea un'istanza VM TPU on demand
Per creare un'istanza VM TPU on demand, utilizza il
comando gcloud compute instances create:
gcloud compute instances create TPU_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--zone=ZONE \
--maintenance-policy=TERMINATE
Sostituisci i seguenti segnaposto:
- TPU_NAME: un nome per la VM TPU.
- MACHINE_TYPE: il tipo di macchina
per la VM TPU (ad esempio
ct6e-standard-8t). - IMAGE_FAMILY: la famiglia di immagini del sistema operativo
per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag
--image. Per ulteriori informazioni sulle immagini sistema operativo, consulta Immagini sistema operativo. - IMAGE_PROJECT: il progetto che contiene l'immagine sistema operativo. Per le immagini TPU, questo è
ubuntu-os-accelerator-images. - ZONE: la zona
per la VM TPU (ad esempio
us-central1-b).
Crea un'istanza VM spot TPU
Per creare un'istanza VM spot TPU, utilizza il
comando gcloud compute instances create
con il flag --provisioning-model=SPOT:
gcloud compute instances create TPU_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--zone=ZONE \
--provisioning-model=SPOT \
--instance-termination-action=DELETE \
--maintenance-policy=TERMINATE
Sostituisci i seguenti segnaposto:
- TPU_NAME: un nome per la VM TPU.
- MACHINE_TYPE: il tipo di macchina
per la VM TPU (ad esempio
ct6e-standard-8t). - IMAGE_FAMILY: la famiglia di immagini del sistema operativo
per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag
--image. Per ulteriori informazioni sulle immagini sistema operativo, consulta Immagini sistema operativo. - IMAGE_PROJECT: il progetto che contiene l'immagine sistema operativo. Per le immagini TPU, questo è
ubuntu-os-accelerator-images. - ZONE: la zona
per la VM TPU (ad esempio
us-central1-b).
Creare un'istanza VM TPU utilizzando una prenotazione
Per creare un'istanza VM TPU utilizzando l'opzione di consumo Con prenotazione,
utilizza il
comando gcloud compute instances create
con i flag --reservation-affinity=specific e --reservation:
gcloud compute instances create TPU_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--zone=ZONE \
--provisioning-model=reservation-bound \
--reservation-affinity=specific \
--reservation=RESERVATION_NAME \
--instance-termination-action=DELETE \
--maintenance-policy=TERMINATE
Sostituisci i seguenti segnaposto:
- TPU_NAME: un nome per la VM TPU.
- MACHINE_TYPE: il tipo di macchina
per la VM TPU (ad esempio
ct6e-standard-8t). - IMAGE_FAMILY: la famiglia di immagini del sistema operativo
per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag
--image. Per ulteriori informazioni sulle immagini sistema operativo, consulta Immagini sistema operativo. - IMAGE_PROJECT: il progetto che contiene l'immagine sistema operativo. Per le immagini TPU, questo è
ubuntu-os-accelerator-images. - ZONE: la zona
per la VM TPU (ad esempio
us-central1-b). - RESERVATION_NAME: il nome della prenotazione.
Crea una VM TPU Flex-start
Per creare un'istanza VM TPU Flex-start, utilizza il
comando gcloud compute instances create
con il flag --provisioning-model=FLEX_START:
gcloud compute instances create TPU_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--zone=ZONE \
--provisioning-model=FLEX_START \
--max-run-duration=MAX_RUN_DURATION \
--request-valid-for-duration=VALID_DURATION \
--instance-termination-action=DELETE \
--maintenance-policy=TERMINATE
Sostituisci i seguenti segnaposto:
- TPU_NAME: un nome per la VM TPU.
- MACHINE_TYPE: il tipo di macchina
per la VM TPU (ad esempio
ct6e-standard-8t). - IMAGE_FAMILY: la famiglia di immagini del sistema operativo
per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag
--image. Per ulteriori informazioni sulle immagini sistema operativo, consulta Immagini sistema operativo. - IMAGE_PROJECT: il progetto che contiene l'immagine sistema operativo. Per le immagini TPU, questo è
ubuntu-os-accelerator-images. - ZONE: la zona
per la VM TPU (ad esempio
us-central1-b). - MAX_RUN_DURATION: la durata massima di esecuzione della VM TPU (ad esempio
6h). - VALID_DURATION: La durata massima per cui la richiesta è valida.
Per saperne di più sulla creazione di istanze Compute Engine, consulta Crea e avvia un'istanza Compute Engine.
Limitazioni
Operazioni del ciclo di vita: non puoi arrestare, avviare, riprendere o sospendere le istanze TPU. Per modificare le configurazioni che richiedono un riavvio o per interrompere l'addebito dei costi, devi eliminare le istanze.
Aggiorna i dettagli della VM: puoi aggiornare le proprietà che richiedono solo un'azione di aggiornamento (
REFRESH). Se una configurazione richiede un riavvio (RESTART), devi ricreare l'istanza.
Passaggi successivi
- Connettiti a un'istanza TPU
- Visualizza i dettagli di un'istanza TPU
- Monitorare le TPU
- Elimina un'istanza TPU