Questo documento descrive come creare un gruppo di istanze gestite (MIG) che forma una sezione TPU multi-host.
Prima di iniziare
- Esamina le limitazioni per la creazione di MIG con istanze TPU.
-
Se non l'hai ancora fatto, configura l'autenticazione.
L'autenticazione verifica la tua identità per l'accesso ad API e servizi Google Cloud . Per eseguire
codice o esempi da un ambiente di sviluppo locale, puoi autenticarti in
Compute Engine selezionando una delle seguenti opzioni:
-
Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il seguente comando:
gcloud initSe utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
- Imposta una regione e una zona predefinite.
-
Prerequisiti
Prima di procedere alla creazione di una sezione TPU multi-host, devi:
Scegliere la versione TPU: seleziona la versione TPU adatta al tuo carico di lavoro. Per un elenco delle versioni TPU per tipo di carico di lavoro, consulta Versioni TPU consigliate per tipo di carico di lavoro.
Convalidare la disponibilità della TPU nella località preferita: le TPU sono disponibili in regioni specifiche Google Cloud . Per utilizzare una versione TPU, assicurati che sia disponibile nella regione che preferisci. Per un elenco delle località TPU, consulta Disponibilità delle TPU.
Assicurati che il tuo progetto abbia una quota TPU sufficiente: se crei una sezione TPU multi-host con VM on demand o Spot, devi avere una quota TPU sufficiente disponibile nella regione che vuoi utilizzare. La creazione di una sezione TPU multi-host che utilizza una prenotazione TPU non richiede alcuna quota TPU, poiché la quota viene utilizzata al momento della creazione della prenotazione. Per un elenco dei nomi delle quote TPU, consulta Quota TPU e, per istruzioni su come visualizzare la quota, consulta Visualizza e gestisci le quote
Scegliere un'opzione di consumo TPU: seleziona un'opzione di consumo che si adatti meglio al tuo carico di lavoro, alla sua durata e alle tue esigenze di costo. Per un elenco della disponibilità delle opzioni di consumo per versione TPU, consulta Opzioni di consumo TPU.
Scegliere una topologia: seleziona una topologia supportata per la versione TPU selezionata. Per un elenco delle topologie disponibili per ogni versione TPU, consulta Topologia TPU.
Creare un MIG con sezioni TPU multi-host
- Crea un template di istanza.
- Crea una policy del workload.
- Crea il MIG.
Creare un template di istanza
Il comando per creare un template di istanza dipende dall'opzione di consumo che utilizzi: on demand, Spot, con prenotazione o con avvio flessibile. Per ulteriori informazioni sulle opzioni di consumo, consulta Informazioni sui modelli di provisioning delle VM.
Creare un template di istanza per una VM TPU on demand
Il seguente comando crea un template di istanza utilizzando l'opzione di consumo on demand:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Sostituisci i seguenti segnaposto:
INSTANCE_TEMPLATE_NAME: il nome del template di istanza.MACHINE_TYPE: il tipo di macchina per la VM TPU, ad esempioct6e-standard-8t.IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il--imageflag. Per ulteriori informazioni sulle immagini del sistema operativo, consulta Immagini del sistema operativo.IMAGE_PROJECT: il progetto che contiene l'immagine del sistema operativo. Per le immagini TPU, questo èubuntu-os-accelerator-images.
Creare un template di istanza per una VM TPU Spot
Il seguente comando crea un template di istanza utilizzando l'opzione di consumo Spot:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=STOP \
--provisioning-model=SPOT \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Sostituisci i seguenti segnaposto:
INSTANCE_TEMPLATE_NAME: il nome del template di istanza.MACHINE_TYPE: il tipo di macchina per la VM TPU, ad esempioct6e-standard-8t.IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il--imageflag. Per ulteriori informazioni sulle immagini del sistema operativo, consulta Immagini del sistema operativo.IMAGE_PROJECT: il progetto che contiene l'immagine del sistema operativo. Per le immagini TPU, questo èubuntu-os-accelerator-images.
Creare un template di istanza per una VM TPU con prenotazione
Il seguente comando crea un template di istanza utilizzando l'opzione di consumo con prenotazione:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--reservation-affinity=specific \
--provisioning-model=reservation-bound \
--reservation=RESERVATION_NAME \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Sostituisci i seguenti segnaposto:
INSTANCE_TEMPLATE_NAME: il nome del template di istanza.MACHINE_TYPE: il tipo di macchina per la VM TPU, ad esempioct6e-standard-8t.RESERVATION_NAME: il nome della prenotazione specifica da utilizzare.IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il--imageflag. Per ulteriori informazioni sulle immagini del sistema operativo, consulta Immagini del sistema operativo.IMAGE_PROJECT: il progetto che contiene l'immagine del sistema operativo. Per le immagini TPU, questo èubuntu-os-accelerator-images.
Creare un template di istanza per una VM TPU con avvio flessibile
Il seguente comando crea un template di istanza utilizzando l'opzione di consumo con avvio flessibile:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--provisioning-model=FLEX_START \
--max-run-duration=DURATION \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Sostituisci i seguenti segnaposto:
INSTANCE_TEMPLATE_NAME: il nome del template di istanza.MACHINE_TYPE: il tipo di macchina per la VM TPU, ad esempioct6e-standard-8t.DURATION: la durata massima per cui la VM TPU può essere eseguita.IMAGE_FAMILY: la famiglia di immagini del sistema operativo per la VM TPU. Se vuoi installare una versione specifica del sistema operativo, utilizza il--imageflag. Per ulteriori informazioni sulle immagini del sistema operativo, consulta Immagini del sistema operativo.IMAGE_PROJECT: il progetto che contiene l'immagine del sistema operativo. Per le immagini TPU, questo èubuntu-os-accelerator-images.
Creare una policy del workload
Devi creare una policy del workload con il parametro accelerator-topology (ad
esempio, 4x4, 8x8 o 4x4x4). La topologia dell'acceleratore configura il MIG
in modo che tratti le istanze come una singola sezione interconnessa.
Il seguente comando crea una policy del workload:
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--type=high-throughput \
--accelerator-topology=TOPOLOGY \
--region=REGION
Sostituisci i seguenti segnaposto:
WORKLOAD_POLICY_NAME: il nome della policy del workload.TOPOLOGY: la topologia delle VM TPU, ad esempio4x4x8. Per ulteriori informazioni sulla topologia per ogni versione di TPU, consulta Topologia TPU.REGION: la regione per la policy del workload.
Creare un MIG
Crea un MIG a livello di zona o di regione utilizzando il
gcloud compute instance-groups managed create comando
come segue:
Per creare un MIG a livello di zona contenente una sezione TPU multi-host, utilizza il seguente comando:
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --target-size-policy-mode=bulk \ --template=INSTANCE_TEMPLATE_URL \ --zone=ZONE \ --default-action-on-vm-failure=do-nothing \ --workload-policy=WORKLOAD_POLICY_URLPer creare un MIG a livello di regione contenente una sezione TPU multi-host, utilizza il seguente comando:
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --target-size-policy-mode=bulk \ --template=INSTANCE_TEMPLATE_URL \ --region=REGION \ --default-action-on-vm-failure=do-nothing \ --workload-policy=WORKLOAD_POLICY_URL \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none
Sostituisci i seguenti segnaposto:
MIG_NAME: il nome del MIG.MIG_SIZE: il numero di VM nel MIG.INSTANCE_TEMPLATE_URL: l'URL del template di istanza che vuoi utilizzare per creare istanze nel MIG. L'URL può contenere l' ID o il nome del template di istanza. Specifica uno dei seguenti valori:- Per un template di istanza regionale:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Per un template di istanza globale:
INSTANCE_TEMPLATE_ID
- Per un template di istanza regionale:
ZONE: la zona per il MIG.REGION: la regione per il MIG.WORKLOAD_POLICY_URL: l'URL della policy del workload che vuoi utilizzare per creare istanze nel MIG. Ad esempio:projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME.
Creare VM con nomi personalizzati in un MIG
Puoi creare VM in un MIG specificando nomi personalizzati per ogni VM. Questa opzione è utile per il debug e per garantire che le istanze vengano create in un ordine specifico.
I MIG che contengono una sezione TPU multi-host utilizzano la modalità in blocco della policy della dimensione target. Quando crei VM con nomi personalizzati in un MIG di questo tipo, si applica quanto segue:
Devi prima verificare che il MIG non contenga VM. Se il MIG contiene VM, devi ridimensionare il MIG alla dimensione target
0o creare un altro MIG con dimensione target0.Puoi utilizzare l'API REST solo per creare VM con nomi personalizzati.
Crea VM con nomi personalizzati utilizzando uno dei seguenti metodi dell'API REST:
Per un MIG a livello di zona, utilizza
instanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }Per un MIG a livello di regione, utilizza
regionInstanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }
Sostituisci i seguenti segnaposto:
PROJECT_ID: l'ID del progetto in cui esiste il MIG.ZONE: la zona del MIG.REGION: la regione del MIG.INSTANCE_NAME_1,2,..: i nomi delle VM da aggiungere al MIG specificato.
Passaggi successivi
- Connettiti a un'istanza TPU
- Visualizza le proprietà di un MIG
- Visualizza lo stato di una sezione TPU
- Monitora le TPU
- Elimina un MIG