Crea un'istanza VM TPU

Questo documento descrive come creare un'istanza di macchina virtuale (VM) TPU. Una VM TPU è chiamata anche slice TPU a host singolo.

Per creare un gruppo di sezioni single-host, consulta Crea un MIG con sezioni TPU single-host.

Prima di iniziare

  • Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione verifica la tua identità per l'accesso ad API e servizi Google Cloud . Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:
    1. Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:

      gcloud init

      Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.

    2. Imposta una regione e una zona predefinite.

Prerequisiti

Prima di procedere alla creazione di un'istanza TPU, devi:

  1. Scegli la versione TPU: seleziona la versione TPU adatta al tuo workload. Per un elenco delle versioni TPU per tipo di workload, consulta Versioni TPU consigliate per tipo di workload.

  2. Verifica la disponibilità di TPU nella tua località preferita: le TPU sono disponibili in regioni Google Cloud specifiche. Per utilizzare una versione della TPU, assicurati che sia disponibile nella regione che preferisci. Per un elenco delle località TPU, consulta Disponibilità delle TPU.

  3. Assicurati che il tuo progetto disponga di una quota TPU sufficiente: se stai creando un'istanza TPU con VM on demand o spot, devi disporre di una quota TPU sufficiente disponibile nella regione che vuoi utilizzare. La creazione di un'istanza TPU che utilizza una prenotazione TPU non richiede alcuna quota TPU, in quanto la quota viene utilizzata al momento della creazione della prenotazione. Per un elenco dei nomi delle quote TPU, consulta Quota TPU e per istruzioni su come visualizzare la quota, consulta Visualizza e gestisci le quote.

  4. Scegli un'opzione di consumo TPU: seleziona un'opzione di consumo più adatta al tuo workload, alla sua durata e alle tue esigenze di costo. Per un elenco delle opzioni di consumo disponibili per versione TPU, consulta Opzioni di consumo TPU.

Crea un'istanza VM TPU

I parametri che utilizzi per creare un'istanza VM TPU dipendono dall'opzione di consumo che utilizzi: on demand, spot, con prenotazione o con avvio flessibile. Per maggiori informazioni, vedi Informazioni sui modelli di provisioning delle VM .

Crea un'istanza VM TPU on demand

Per creare un'istanza VM TPU on demand, utilizza il comando gcloud compute instances create:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --maintenance-policy=TERMINATE

Sostituisci i seguenti segnaposto:

  • TPU_NAME: un nome per la VM TPU.
  • MACHINE_TYPE: il tipo di macchina per la VM TPU (ad esempio ct6e-standard-8t).
  • IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag --image. Per ulteriori informazioni sulle immagini sistema operativo, consulta Immagini sistema operativo.
  • IMAGE_PROJECT: il progetto che contiene l'immagine sistema operativo. Per le immagini TPU, questo è ubuntu-os-accelerator-images.
  • ZONE: la zona per la VM TPU (ad esempio us-central1-b).

Crea un'istanza VM spot TPU

Per creare un'istanza VM spot TPU, utilizza il comando gcloud compute instances create con il flag --provisioning-model=SPOT:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --provisioning-model=SPOT \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE

Sostituisci i seguenti segnaposto:

  • TPU_NAME: un nome per la VM TPU.
  • MACHINE_TYPE: il tipo di macchina per la VM TPU (ad esempio ct6e-standard-8t).
  • IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag --image. Per ulteriori informazioni sulle immagini sistema operativo, consulta Immagini sistema operativo.
  • IMAGE_PROJECT: il progetto che contiene l'immagine sistema operativo. Per le immagini TPU, questo è ubuntu-os-accelerator-images.
  • ZONE: la zona per la VM TPU (ad esempio us-central1-b).

Creare un'istanza VM TPU utilizzando una prenotazione

Per creare un'istanza VM TPU utilizzando l'opzione di consumo Con prenotazione, utilizza il comando gcloud compute instances create con i flag --reservation-affinity=specific e --reservation:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --provisioning-model=reservation-bound \
    --reservation-affinity=specific \
    --reservation=RESERVATION_NAME \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE

Sostituisci i seguenti segnaposto:

  • TPU_NAME: un nome per la VM TPU.
  • MACHINE_TYPE: il tipo di macchina per la VM TPU (ad esempio ct6e-standard-8t).
  • IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag --image. Per ulteriori informazioni sulle immagini sistema operativo, consulta Immagini sistema operativo.
  • IMAGE_PROJECT: il progetto che contiene l'immagine sistema operativo. Per le immagini TPU, questo è ubuntu-os-accelerator-images.
  • ZONE: la zona per la VM TPU (ad esempio us-central1-b).
  • RESERVATION_NAME: il nome della prenotazione.

Crea una VM TPU Flex-start

Per creare un'istanza VM TPU Flex-start, utilizza il comando gcloud compute instances create con il flag --provisioning-model=FLEX_START:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --provisioning-model=FLEX_START \
    --max-run-duration=MAX_RUN_DURATION \
    --request-valid-for-duration=VALID_DURATION \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE

Sostituisci i seguenti segnaposto:

  • TPU_NAME: un nome per la VM TPU.
  • MACHINE_TYPE: il tipo di macchina per la VM TPU (ad esempio ct6e-standard-8t).
  • IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il flag --image. Per ulteriori informazioni sulle immagini sistema operativo, consulta Immagini sistema operativo.
  • IMAGE_PROJECT: il progetto che contiene l'immagine sistema operativo. Per le immagini TPU, questo è ubuntu-os-accelerator-images.
  • ZONE: la zona per la VM TPU (ad esempio us-central1-b).
  • MAX_RUN_DURATION: la durata massima di esecuzione della VM TPU (ad esempio 6h).
  • VALID_DURATION: La durata massima per cui la richiesta è valida.

Per saperne di più sulla creazione di istanze Compute Engine, consulta Crea e avvia un'istanza Compute Engine.

Limitazioni

  • Operazioni del ciclo di vita: non puoi arrestare, avviare, riprendere o sospendere le istanze TPU. Per modificare le configurazioni che richiedono un riavvio o per interrompere l'addebito dei costi, devi eliminare le istanze.

  • Aggiorna i dettagli della VM: puoi aggiornare le proprietà che richiedono solo un'azione di aggiornamento (REFRESH). Se una configurazione richiede un riavvio (RESTART), devi ricreare l'istanza.

Passaggi successivi