Questo documento descrive come creare un gruppo di istanze gestite (MIG) che utilizza i tipi di macchine A4 o A3 Ultra. Per saperne di più su questi tipi di macchine ottimizzati per l'acceleratore, consulta A4 o A3 Ultra.
La creazione di un MIG ti consente di gestire più macchine virtuali (VM) come singola entità. Ogni VM in un MIG si basa su un template di istanza. Gestendo automaticamente le VM nel gruppo, i MIG offrono alta disponibilità e scalabilità. Per scoprire di più sui MIG, consulta Gruppi di istanze gestite nella documentazione di Compute Engine.
Per scoprire altri modi per creare VM o cluster, consulta la pagina Panoramica della creazione di VM e cluster.
Limitazioni
Quando crei un MIG con VM A4 o A3 Ultra, tieni presente le limitazioni per il tipo di macchina e il MIG.
Limitazioni per le VM A4 o A3 Ultra
A seconda della serie di macchine utilizzata dalle VM nel MIG, si applicano le seguenti limitazioni:
A4
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A4.
- Puoi utilizzare un tipo di macchina A4 solo in alcune regioni e zone.
- Non puoi utilizzare Persistent Disk (a livello di regione o di zona). Puoi utilizzare solo Google Cloud Hyperdisk.
- Il tipo di macchina A4 è disponibile solo sulla piattaforma CPU Emerald Rapids.
- Non puoi modificare il tipo di macchina di un'istanza in o da un tipo di macchina A4. Devi creare una nuova istanza con questo tipo di macchina.
- I tipi di macchine A4 non supportano la modalità single-tenancy.
- Non puoi eseguire sistemi operativi Windows su un tipo di macchina A4.
- Per le istanze A4, quando utilizzi
ethtool -Sper monitorare il networking GPU, i contatori delle porte fisiche che terminano con_phynon vengono aggiornati. Si tratta di un comportamento previsto per le istanze che utilizzano l'architettura della funzione virtuale (VF) MRDMA. Per saperne di più, consulta Funzioni MRDMA e strumenti di monitoraggio della rete. - Non puoi collegare i dischi Hyperdisk ML creati prima del 4 febbraio 2026 ai tipi di macchina A4.
A3 Ultra
- Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 Ultra.
- Puoi utilizzare un tipo di macchina A3 Ultra solo in alcune regioni e zone.
- Non puoi utilizzare Persistent Disk (a livello di regione o di zona). Puoi utilizzare solo Google Cloud Hyperdisk.
- Il tipo di macchina A3 Ultra è disponibile solo sulla piattaforma CPU Emerald Rapids.
- Le modifiche al tipo di macchina non sono supportate per il tipo di macchina A3 Ultra. Per passare a questo tipo di macchina o viceversa, devi creare una nuova istanza.
- Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Ultra.
- I tipi di macchine A3 Ultra non supportano la modalità single-tenancy.
- Per le istanze A3 Ultra, quando utilizzi
ethtool -Sper monitorare il networking GPU, i contatori delle porte fisiche che terminano con_phynon vengono aggiornati. Questo è il comportamento previsto per le istanze che utilizzano l'architettura della funzione virtuale (VF) MRDMA. Per saperne di più, consulta Funzioni MRDMA e strumenti di monitoraggio della rete.
Limitazioni per il MIG
Quando crei un MIG con VM A4 o A3 Ultra, si applicano le seguenti limitazioni:
Se il modello di istanza da utilizzare per il MIG specifica il modello di provisioning con avvio flessibile, si applicano le seguenti limitazioni:
Puoi aggiungere VM al MIG solo utilizzando le richieste di ridimensionamento.
Non puoi applicare una policy del workload al MIG.
Devi disattivare le riparazioni nel MIG.
Se crei un MIG regionale, questo può creare VM solo nella zona che contiene il profilo della rete VPC.
Non puoi configurare la flessibilità delle istanze nel MIG.
Se applichi una policy del workload a un MIG, non puoi modificare la policy nel MIG quando il gruppo contiene VM. Per modificare il criterio in un MIG con VM, devi prima ridimensionare il MIG a zero.
Non puoi utilizzare un template di istanza che specifica una policy di posizionamento per creare un MIG che utilizza una policy del workload.
Quando crei richieste di ridimensionamento del gruppo di istanze gestite, si applicano le seguenti limitazioni:
In un MIG a livello di regione, puoi utilizzare solo la forma di distribuzione target
ANY_SINGLE_ZONE(Anteprima). Le altre forme di distribuzione non sono supportate.Puoi impostare la modalità pool di standby del MIG solo su
manual(predefinito).Non puoi impostare la scalabilità automatica.
Se il MIG contiene richieste di ridimensionamento accettate, non puoi:
Aggiungere un secondo template di istanza per avviare un aggiornamento canary nel MIG.
Modificare le dimensioni target del MIG.
Eliminare o abbandonare le istanze gestite in uno stato
CREATINGcreato dal MIG per una richiesta di ridimensionamento. Per eliminare queste istanze gestite, devi annullare la richiesta di ridimensionamento.
Prima di iniziare
Prima di creare un MIG, se non l'hai ancora fatto, completa i seguenti passaggi:
- Scegli un'opzione di consumo: l'opzione di consumo scelta determina come ottenere
e utilizzare le risorse GPU.
Per saperne di più, consulta la sezione Scegliere un'opzione di consumo.
- Ottenere capacità: la procedura per ottenere capacità varia a seconda dell'opzione di consumo.
Per scoprire di più sulla procedura per ottenere la capacità per l'opzione di consumo scelta, consulta Panoramica della capacità.
Ruoli obbligatori
Per ottenere le autorizzazioni
necessarie per creare un gruppo di istanze gestite,
chiedi all'amministratore di concederti il
ruolo IAM Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1)
nel progetto.
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Questo ruolo predefinito contiene le autorizzazioni necessarie per creare un gruppo di istanze gestite. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per creare un gruppo di istanze gestite sono necessarie le seguenti autorizzazioni:
-
Per creare un MIG:
compute.instanceGroupManagers.createsul progetto
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Panoramica
La creazione di un MIG con il tipo di macchina A4 o A3 Ultra include i seguenti passaggi:
Crea reti VPC
Per configurare la rete per il tipo di macchina A4 o A3 Ultra, crea tre reti VPC per le seguenti interfacce di rete:
- 2 reti VPC standard per le interfacce di rete (NIC) gVNIC. Vengono utilizzati per la comunicazione da host a host.
- Per le NIC CX-7 è necessaria una rete VPC con il profilo di rete RoCE. La rete VPC RoCE deve avere 8 subnet, una per ogni NIC CX-7. Queste NIC utilizzano RDMA su Converged Ethernet (RoCE), fornendo la comunicazione a larghezza di banda elevata e bassa latenza essenziale per la comunicazione da GPU a GPU.
Per ulteriori informazioni sulla disposizione del NIC, consulta Controlla la larghezza di banda della rete e la disposizione del NIC.
Crea le reti manualmente seguendo le guide o automaticamente utilizzando lo script fornito.
Guide con istruzioni
Per creare le reti, puoi utilizzare le seguenti istruzioni:
- Per creare le normali reti VPC per le gNIC, consulta Crea e gestisci le reti Virtual Private Cloud.
- Per creare la rete VPC RoCE, consulta Crea una rete Virtual Private Cloud per le NIC RDMA.
Per queste reti VPC, ti consigliamo di impostare l'unità massima di trasmissione (MTU) su un valore maggiore.
Per il tipo di macchina A4 o A3 Ultra, l'MTU consigliata è di 8896 byte.
Per esaminare le impostazioni MTU consigliate per altri tipi di macchine GPU, consulta
Impostazioni MTU per i tipi di macchine GPU.
Script
Per creare le reti, segui questi passaggi.
Per queste reti VPC, ti consigliamo di impostare l'unità massima di trasmissione (MTU) su un valore maggiore.
Per il tipo di macchina A4 o A3 Ultra, l'MTU consigliata è di 8896 byte.
Per esaminare le impostazioni MTU consigliate per altri tipi di macchine GPU, consulta
Impostazioni MTU per i tipi di macchine GPU.
Utilizza il seguente script per creare reti VPC per le NIC gVNIC e CX-7.
#!/bin/bash # Create regular VPC networks and subnets for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=10.$N.0.0/16 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=10.0.0.0/8 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGE # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 7); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs doneSostituisci quanto segue:
GVNIC_NAME_PREFIX: il prefisso del nome personalizzato da utilizzare per le reti VPC e le subnet regolari per le gNIC.RDMA_NAME_PREFIX: il prefisso del nome personalizzato da utilizzare per la rete VPC e le subnet RoCE per le NIC CX-7.ZONE: specifica una zona in cui è disponibile il tipo di macchina che vuoi utilizzare, ad esempious-central1-a. Per informazioni sulle regioni, consulta la sezione Disponibilità delle GPU per regioni e zone.REGION: la regione in cui vuoi creare le subnet. Questa regione deve corrispondere alla zona specificata. Ad esempio, se la tua zona èus-central1-a, la tua regione èus-central1.IP_RANGE: l'intervallo IP da utilizzare per le regole firewall SSH.
- (Facoltativo) Per verificare che le risorse di rete VPC siano state create correttamente, controlla le impostazioni di rete nella console Google Cloud :
- Nella console Google Cloud , vai alla pagina Reti VPC.
- Cerca nell'elenco le reti che hai creato nel passaggio precedente.
- Per visualizzare le subnet, le regole firewall e altre impostazioni di rete, fai clic sul nome della rete.
(Facoltativo) Crea una policy del workload
Per l'opzione di consumo con avvio flessibile, salta questa sezione e vai a creare un modello di istanza. A causa di limitazioni, il modello di provisioning con avvio flessibile non supporta le policy del workload.Puoi specificare il posizionamento delle VM creando una policy del workload. Se hai già una policy
del workload, puoi riutilizzarla. Quando applichi una policy del workload al tuo MIG, Compute Engine tenta di creare VM il più vicine possibile tra loro. Se la tua applicazione
è sensibile alla latenza e vuoi che le VM siano più vicine tra loro (massima compattezza), specifica
il campo maxTopologyDistance quando crei una policy del workload.
Non puoi aggiornare una policy del workload dopo averla creata. Per apportare modifiche a un criterio del workload, devi crearne uno nuovo.
Per creare una policy del workload, seleziona una delle seguenti opzioni:
gcloud
Per creare una policy del workload, utilizza il
comando gcloud compute resource-policies create workload-policy.
-
Per un posizionamento delle VM secondo il criterio del "best effort", specifica solo il flag
--type=high-throughputnel comando:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGION -
Per il posizionamento rigoroso delle VM, specifica il flag
--max-topology-distancenel comando:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --max-topology-distance=TOPOLOGY_DISTANCE \ --region=REGION
Sostituisci quanto segue:
WORKLOAD_POLICY_NAME: il nome della policy del workload.TOPOLOGY_DISTANCE: la distanza topologia massima. Specifica uno dei seguenti valori:- Per posizionare le VM nello stesso cluster:
CLUSTER - Per posizionare le VM nello stesso blocco:
BLOCK - Per posizionare le VM nello stesso blocco secondario:
SUBBLOCK
Nota: una distanza massima più breve può ridurre la probabilità di disponibilità della VM.- Per posizionare le VM nello stesso cluster:
REGION: la regione in cui vuoi creare la policy del workload. Specifica una regione in cui vuoi creare il MIG e il tipo di macchina che vuoi utilizzare è disponibile. Per informazioni sulle regioni, consulta la sezione Disponibilità delle GPU per regioni e zone.
REST
Per creare una policy del workload, invia una richiesta POST
al metodo resourcePolicies.insert.
-
Per un posizionamento delle VM con il massimo impegno, specifica solo il campo
typenella richiesta nel seguente modo:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME" "workloadPolicy": { "type": "HIGH_THROUGHPUT" } } -
Per la collocazione rigorosa delle VM, specifica il campo
maxTopologyDistancenella richiesta nel seguente modo:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME" "workloadPolicy": { "type": "HIGH_THROUGHPUT", "maxTopologyDistance": "TOPOLOGY_DISTANCE" } }
Sostituisci quanto segue:
PROJECT_ID: il tuo ID progettoREGION: la regione in cui vuoi creare la policy del workload. Specifica una regione in cui vuoi creare il MIG e il tipo di macchina che vuoi utilizzare è disponibile. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.WORKLOAD_POLICY_NAME: il nome della policy del workload.TOPOLOGY_DISTANCE: la distanza topologia massima. Specifica uno dei seguenti valori:- Per posizionare le VM nello stesso blocco:
BLOCK - Per posizionare le VM nello stesso cluster:
CLUSTER
Nota: una distanza massima più breve può ridurre la probabilità di disponibilità della VM.- Per posizionare le VM nello stesso blocco:
Crea un modello di istanza
Specifica le proprietà della VM per un MIG creando un modello di istanza.
Per creare un template di istanza, seleziona una delle seguenti opzioni.
I seguenti comandi impostano anche l'ambito di accesso per le tue istanze. Per semplificare la gestione delle autorizzazioni, Google consiglia di impostare l'ambito di accesso di un'istanza sucloud-platform e poi utilizzare i ruoli IAM per definire i servizi a cui l'istanza può accedere. Per saperne di più, consulta le best practice per gli ambiti.
gcloud
I parametri da specificare dipendono dall'opzione di consumo che utilizzi per questo deployment. Seleziona la scheda corrispondente al modello di provisioning dell'opzione di consumo.
Avvio flessibile
Per creare un template di istanza regionale, utilizza il
comando gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
--reservation-affinity=none \
--instance-termination-action=DELETE \
--max-run-duration=RUN_DURATION \
--maintenance-policy=TERMINATE \
--provisioning-model=FLEX_START
Sostituisci quanto segue:
INSTANCE_TEMPLATE_NAME: il nome del modello di istanza.MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Specifica un tipo di macchina A4 o A3 Ultra. Per saperne di più, consulta Tipi di macchine GPU.IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Sistemi operativi supportati.IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.REGION: la regione in cui vuoi creare il template di istanza. Specifica una regione in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, consulta la sezione Disponibilità delle GPU per regioni e zone.DISK_SIZE: le dimensioni del disco di avvio in GB.GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano schede di interfaccia di rete gVNIC.RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.RUN_DURATION: la durata per cui vuoi eseguire le VM richieste. Devi formattare il valore come numero di giorni, ore, minuti o secondi seguito rispettivamente dad,h,mes. Ad esempio, specifica30mper 30 minuti o1d2h3m4sper un giorno, due ore, tre minuti e quattro secondi. Il valore deve essere compreso tra 10 minuti e sette giorni.
Con prenotazione
Per creare un template di istanza regionale, utilizza il
comando gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
--reservation-affinity=specific \
--reservation=RESERVATION \
--provisioning-model=RESERVATION_BOUND \
--instance-termination-action=DELETE \
--maintenance-policy=TERMINATE \
--restart-on-failure
Sostituisci quanto segue:
INSTANCE_TEMPLATE_NAME: il nome del modello di istanza.MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Specifica un tipo di macchina A4 o A3 Ultra. Per saperne di più, consulta Tipi di macchine GPU.IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Sistemi operativi supportati.IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.REGION: la regione in cui vuoi creare il template di istanza. Specifica una regione in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, consulta la sezione Disponibilità delle GPU per regioni e zone.DISK_SIZE: le dimensioni del disco di avvio in GB.GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano schede di interfaccia di rete gVNIC.RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.-
RESERVATION: il nome della prenotazione o un blocco specifico all'interno di una prenotazione. Per ottenere il nome della prenotazione o i blocchi disponibili, vedi Visualizzare la capacità riservata. In base al tuo requisito per il posizionamento dell'istanza, scegli una delle seguenti opzioni:Per creare istanze in più blocchi o in un singolo blocco:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Inoltre, per un singolo blocco, crea il MIG applicando una policy di workload che specifica una collocazione di blocchi (
maxTopologyDistance=BLOCK) . Compute Engine applica quindi la policy alla prenotazione e crea istanze sullo stesso blocco.Per creare istanze su un blocco specifico:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Per creare un template di istanza regionale, utilizza il
comando gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
--provisioning-model=SPOT \
--instance-termination-action=TERMINATION_ACTION \
--maintenance-policy=TERMINATE \
--no-restart-on-failure
Sostituisci quanto segue:
INSTANCE_TEMPLATE_NAME: il nome del modello di istanza.MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Specifica un tipo di macchina A4 o A3 Ultra. Per saperne di più, consulta Tipi di macchine GPU.IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Sistemi operativi supportati.IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.REGION: la regione in cui vuoi creare il template di istanza. Specifica una regione in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, consulta la sezione Disponibilità delle GPU per regioni e zone.DISK_SIZE: le dimensioni del disco di avvio in GB.GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano schede di interfaccia di rete gVNIC.RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.TERMINATION_ACTION: l'azione da intraprendere quando Compute Engine prerilascia l'istanza, ovveroSTOP(impostazione predefinita) oDELETE.
REST
I parametri da specificare dipendono dall'opzione di consumo che utilizzi per questo deployment. Seleziona la scheda corrispondente al modello di provisioning dell'opzione di consumo.
Avvio flessibile
Per creare un template di istanza regionale, effettua una richiesta POST al
metodo regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
}
],
"reservationAffinity": {
"consumeReservationType": "NO_RESERVATION"
},
"scheduling": {
"instanceTerminationAction": "DELETE",
"maxRunDuration": {
"seconds": RUN_DURATION
},
"onHostMaintenance": "TERMINATE",
"provisioningModel": "FLEX_START"
}
}
}
Sostituisci quanto segue:
INSTANCE_TEMPLATE_NAME: il nome del modello di istanza.MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Specifica un tipo di macchina A4 o A3 Ultra. Per saperne di più, consulta Tipi di macchine GPU.IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Sistemi operativi supportati.IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.REGION: la regione in cui vuoi creare il template di istanza. Specifica una regione in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.DISK_SIZE: le dimensioni del disco di avvio in GB.NETWORK_PROJECT_ID: l'ID progetto della rete.GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano schede di interfaccia di rete gVNIC.REGION: la regione della subnet.RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.RUN_DURATION: la durata, in secondi, per cui vuoi eseguire le VM richieste. Il valore deve essere compreso tra600, ovvero 600 secondi (10 minuti), e604800, ovvero 604.800 secondi (sette giorni).
Con prenotazione
Per creare un template di istanza regionale, effettua una richiesta POST al
metodo regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
}
],
"reservationAffinity":{
"consumeReservationType":"SPECIFIC_RESERVATION",
"key":"compute.googleapis.com/reservation-name",
"values":[
"RESERVATION"
]
},
"scheduling":{
"provisioningModel":"RESERVATION_BOUND",
"instanceTerminationAction":"DELETE",
"onHostMaintenance": "TERMINATE",
"automaticRestart":true
}
}
}
Sostituisci quanto segue:
INSTANCE_TEMPLATE_NAME: il nome del modello di istanza.MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Specifica un tipo di macchina A4 o A3 Ultra. Per saperne di più, consulta Tipi di macchine GPU.IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Sistemi operativi supportati.IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.REGION: la regione in cui vuoi creare il template di istanza. Specifica una regione in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.DISK_SIZE: le dimensioni del disco di avvio in GB.NETWORK_PROJECT_ID: l'ID progetto della rete.GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano schede di interfaccia di rete gVNIC.REGION: la regione della subnet.RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.-
RESERVATION: il nome della prenotazione o un blocco specifico all'interno di una prenotazione. Per ottenere il nome della prenotazione o i blocchi disponibili, vedi Visualizzare la capacità riservata. In base al tuo requisito per il posizionamento dell'istanza, scegli una delle seguenti opzioni:Per creare istanze in più blocchi o in un singolo blocco:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Inoltre, per un singolo blocco, crea il MIG applicando una policy di workload che specifica una collocazione di blocchi (
maxTopologyDistance=BLOCK) . Compute Engine applica quindi la policy alla prenotazione e crea istanze sullo stesso blocco.Per creare istanze su un blocco specifico:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Per creare un template di istanza regionale, effettua una richiesta POST al
metodo regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
}
],
"scheduling":
{
"provisioningModel": "SPOT",
"instanceTerminationAction": "TERMINATION_ACTION",
"onHostMaintenance": "TERMINATE",
"automaticRestart": false
}
}
}
Sostituisci quanto segue:
INSTANCE_TEMPLATE_NAME: il nome del modello di istanza.MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Specifica un tipo di macchina A4 o A3 Ultra. Per saperne di più, consulta Tipi di macchine GPU.IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Sistemi operativi supportati.IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.REGION: la regione in cui vuoi creare il template di istanza. Specifica una regione in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.DISK_SIZE: le dimensioni del disco di avvio in GB.NETWORK_PROJECT_ID: l'ID progetto della rete.GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano schede di interfaccia di rete gVNIC.REGION: la regione della subnet.RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.TERMINATION_ACTION: l'azione da intraprendere quando Compute Engine prerilascia l'istanza, ovveroSTOP(impostazione predefinita) oDELETE.
Dopo aver creato il modello di istanza, puoi visualizzarlo per vedere il suo ID e rivedere le proprietà dell'istanza.
Crea un MIG
Dopo aver completato tutti i passaggi precedenti, crea un gruppo di istanze gestite in base al tuo scenario nel seguente modo:
| Scenario | Metodo per creare un MIG e le relative VM | Esempio |
|---|---|---|
| Hai più job paralleli che possono iniziare con un numero qualsiasi di VM. | Crea un MIG e utilizza la dimensione target per specificare il numero di VM che vuoi nel gruppo. |
Job di inferenza ML |
| Hai un job che richiede la distribuzione su un numero esatto di VM. | Crea un MIG senza VM e poi crea una richiesta di ridimensionamento nel MIG.
La richiesta di ridimensionamento ti aiuta a ottenere le VM tutte insieme. Consulta Crea un gruppo di istanze gestite e una richiesta di ridimensionamento. |
Job di addestramento e messa a punto di ML distribuiti |
Crea un MIG con dimensioni target
Se puoi avviare il job senza creare tutte le VM contemporaneamente, crea un MIG con una dimensione target. La dimensione target determina il numero di VM nel MIG. Il MIG inizia a creare VM in base alla disponibilità attuale delle risorse. Se una risorsa non è temporaneamente disponibile, il MIG tenta continuamente di creare VM per raggiungere la dimensione target.
Per creare un MIG con una dimensione target, seleziona una delle seguenti opzioni:
gcloud
Per creare un MIG con una dimensione target specificata, utilizza il
comando instance-groups managed
create.
I comandi per creare un MIG utilizzano una policy del workload per specificare il posizionamento delle VM. Se non vuoi utilizzare una policy del workload, rimuovi il flag --workload-policy.
Crea un gruppo di istanze gestite a livello di zona o di regione nel seguente modo:
- Per creare un gruppo di istanze gestite a livello di zona, utilizza questo comando:
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE
- Per creare un gruppo di istanze gestite a livello di regione, utilizza il seguente comando:
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --region=REGION
MIG_NAME: il nome del MIG.INSTANCE_TEMPLATE_URL: l'URL del template di istanza che vuoi utilizzare per creare le VM nel MIG. L'URL può contenere l'ID o il nome del modello di istanza. Specifica uno dei seguenti valori:- Per un template di istanza regionale:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Per un template di istanza globale:
INSTANCE_TEMPLATE_ID
- Per un template di istanza regionale:
TARGET_SIZE: il numero di VM che vuoi nel MIG.WORKLOAD_POLICY_URL: (Facoltativo) l'URL del criterio del workload. Ad esempio,projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Se non vuoi utilizzare una policy del workload, puoi rimuovere il flag--workload-policy.ZONE: la zona in cui vuoi creare il gruppo di istanze gestite. Se utilizzi una policy del carico di lavoro, specifica una zona all'interno della regione della policy.REGION: la regione in cui vuoi creare il MIG. Se utilizzi una policy di workload, specifica la stessa regione della policy. Per un MIG a livello di regione, anziché una regione, puoi specificare le zone in quella regione utilizzando il flag--zones.
REST
Per creare un MIG con una dimensione target specificata, invia una richiesta POST.
Le richieste per creare un MIG utilizzano una policy del workload per specificare il posizionamento delle VM. Se non vuoi utilizzare una policy del workload, rimuovi il campo resourcePolicies.workloadPolicy.
Crea un gruppo di istanze gestite a livello di zona o di regione nel seguente modo:
- Per creare un gruppo di istanze gestite a livello di zona, invia una richiesta
POSTal metodoinstanceGroupManagers.insert.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Per creare un MIG a livello di regione, invia una richiesta
POSTal metodoregionInstanceGroupManagers.insert.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } }
PROJECT_ID: l'ID progettoZONE: la zona in cui vuoi creare il MIG. Se utilizzi una policy del carico di lavoro, specifica una zona all'interno della regione della policy.REGION: la regione in cui vuoi creare il MIG. Se utilizzi una policy di workload, specifica la stessa regione della policy.INSTANCE_TEMPLATE_URL: l'URL del template di istanza che vuoi utilizzare per creare le VM nel MIG. L'URL può contenere l'ID o il nome del modello di istanza. Specifica uno dei seguenti valori:- Per un template di istanza regionale:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Per un template di istanza globale:
INSTANCE_TEMPLATE_ID
- Per un template di istanza regionale:
MIG_NAME: il nome del MIG.TARGET_SIZE: il numero di VM che vuoi nel MIG.WORKLOAD_POLICY_URL: (facoltativo) l'URL della policy del workload. Ad esempio,projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Se non vuoi utilizzare una policy del workload, rimuovi il camporesourcePolicies.workloadPolicy.
Crea un gruppo di istanze gestite e una richiesta di ridimensionamento
Se hai bisogno di più VM contemporaneamente per avviare un job, crea un gruppo di istanze gestite e crea una richiesta di ridimensionamento nel gruppo di istanze gestite come descritto in questa sezione.Per creare una richiesta di ridimensionamento in un gruppo di istanze gestite, seleziona una delle seguenti opzioni.
gcloud
I parametri da specificare dipendono dall'opzione di consumo che utilizzi per questo deployment. Seleziona la scheda corrispondente al modello di provisioning dell'opzione di consumo.
Avvio flessibile
Crea un gruppo di istanze gestite a livello di zona o di regione e una richiesta di ridimensionamento come segue:
-
Per creare un gruppo di istanze gestite a livello di zona e una richiesta di ridimensionamento al suo interno:
-
Crea un MIG a livello di zona utilizzando il comando
instance-groups managed createcome segue.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --default-action-on-vm-failure=do-nothing \ --zone=ZONE -
Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di zona utilizzando il comando
instance-groups managed resize-requests createcome segue:gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
Per creare un gruppo di istanze gestite a livello di regione e una richiesta di ridimensionamento al suo interno:
-
Crea un gruppo di istanze gestite a livello di regione utilizzando il comando
instance-groups managed createcome segue.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --default-action-on-vm-failure=do-nothing \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di regione utilizzando il comando beta
instance-groups managed resize-requests createcome segue:gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
Con prenotazione
I comandi per creare un MIG utilizzano una policy del workload per specificare il posizionamento delle VM. Se non vuoi utilizzare una policy del workload, rimuovi il flag --workload-policy.
Crea un gruppo di istanze gestite a livello di zona o di regione e una richiesta di ridimensionamento come segue:
-
Per creare un gruppo di istanze gestite a livello di zona e una richiesta di ridimensionamento al suo interno:
-
Crea un MIG a livello di zona utilizzando il comando
instance-groups managed createcome segue.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE -
Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di zona utilizzando il comando
instance-groups managed resize-requests createcome segue:gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
Per creare un gruppo di istanze gestite a livello di regione e una richiesta di ridimensionamento al suo interno:
-
Crea un gruppo di istanze gestite a livello di regione utilizzando il comando
instance-groups managed createcome segue.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di regione utilizzando il comando beta
instance-groups managed resize-requests createcome segue:gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
Spot
I comandi per creare un MIG utilizzano una policy del workload per specificare il posizionamento delle VM. Se non vuoi utilizzare una policy del workload, rimuovi il flag --workload-policy.
Crea un gruppo di istanze gestite a livello di zona o di regione e una richiesta di ridimensionamento come segue:
-
Per creare un gruppo di istanze gestite a livello di zona e una richiesta di ridimensionamento al suo interno:
-
Crea un MIG a livello di zona utilizzando il comando
instance-groups managed createcome segue.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE -
Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di zona utilizzando il comando
instance-groups managed resize-requests createcome segue:gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
Per creare un gruppo di istanze gestite a livello di regione e una richiesta di ridimensionamento al suo interno:
-
Crea un gruppo di istanze gestite a livello di regione utilizzando il comando
instance-groups managed createcome segue.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di regione utilizzando il comando beta
instance-groups managed resize-requests createcome segue:gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
MIG_NAME: il nome del MIG.INSTANCE_TEMPLATE_URL: l'URL del template di istanza che vuoi utilizzare per creare le VM nel MIG. L'URL può contenere l'ID o il nome del modello di istanza. Specifica uno dei seguenti valori:- Per un template di istanza regionale:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Per un template di istanza globale:
INSTANCE_TEMPLATE_ID
- Per un template di istanza regionale:
WORKLOAD_POLICY_URL: (Facoltativo) l'URL del criterio del workload. Ad esempio,projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Se non vuoi utilizzare una policy del workload, rimuovi il flag--workload-policy.ZONE: la zona in cui vuoi creare il gruppo di istanze gestite. Anche per un MIG a livello di regione, devi specificare una zona. Questa zona deve essere la zona che contiene il profilo per la tua rete VPC e deve essere una zona in cui è disponibile il tipo di macchina. Per ulteriori informazioni, vedi Limitazioni.RESIZE_REQUEST_NAME: il nome della richiesta di ridimensionamento, che deve essere univoco all'interno del gruppo di istanze gestite specificato. In caso contrario, la creazione della richiesta di ridimensionamento non va a buon fine.COUNT: il numero di VM da aggiungere al gruppo di istanze gestite contemporaneamente.REGION: la regione in cui si trova il MIG.
Se il tuo workload richiede determinati nomi per la VM, puoi specificare un elenco di nomi delle VM da
creare utilizzando
il comando beta instance-groups managed resize-requests create.
Nel comando, sostituisci il flag --resize-request con il
flag --instances.
REST
I parametri da specificare dipendono dall'opzione di consumo che utilizzi per questo deployment. Seleziona la scheda corrispondente al modello di provisioning dell'opzione di consumo.
Avvio flessibile
Crea un gruppo di istanze gestite a livello di zona o di regione e una richiesta di ridimensionamento come segue:
- Per creare un gruppo di istanze gestite a livello di zona e una richiesta di ridimensionamento al suo interno, procedi nel seguente modo:
- Crea un MIG a livello di zona inviando una richiesta
POSTal metodoinstanceGroupManagers.insertcome segue.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } } - Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di zona inviando una richiesta
POSTal metodoinstanceGroupManagerResizeRequests.insertcome segue:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Crea un MIG a livello di zona inviando una richiesta
- Per creare un gruppo di istanze gestite a livello di regione e una richiesta di ridimensionamento al suo interno, procedi nel seguente modo:
- Crea un gruppo di istanze gestite a livello di regione inviando una richiesta
POSTal metodoregionInstanceGroupManagers.insertcome segue.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } } - Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di regione inviando una richiesta
POSTal metodobeta.regionInstanceGroupManagerResizeRequests.insertcome segue:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Crea un gruppo di istanze gestite a livello di regione inviando una richiesta
Con prenotazione
Le richieste per creare un MIG utilizzano una policy del workload per specificare il posizionamento delle VM. Se non vuoi utilizzare una policy del workload, rimuovi il campo resourcePolicies.workloadPolicy.
Crea un gruppo di istanze gestite a livello di zona o di regione e una richiesta di ridimensionamento come segue:
- Per creare un gruppo di istanze gestite a livello di zona e una richiesta di ridimensionamento al suo interno, procedi nel seguente modo:
- Crea un MIG a livello di zona inviando una richiesta
POSTal metodoinstanceGroupManagers.insertcome segue.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di zona inviando una richiesta
POSTal metodoinstanceGroupManagerResizeRequests.insertcome segue:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Crea un MIG a livello di zona inviando una richiesta
- Per creare un gruppo di istanze gestite a livello di regione e una richiesta di ridimensionamento al suo interno, procedi nel seguente modo:
- Crea un gruppo di istanze gestite a livello di regione inviando una richiesta
POSTal metodoregionInstanceGroupManagers.insertcome segue.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di regione inviando una richiesta
POSTal metodobeta.regionInstanceGroupManagerResizeRequests.insertcome segue:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Crea un gruppo di istanze gestite a livello di regione inviando una richiesta
Spot
Le richieste per creare un MIG utilizzano una policy del workload per specificare il posizionamento delle VM. Se non vuoi utilizzare una policy del workload, rimuovi il campo resourcePolicies.workloadPolicy.
Crea un gruppo di istanze gestite a livello di zona o di regione e una richiesta di ridimensionamento come segue:
- Per creare un gruppo di istanze gestite a livello di zona e una richiesta di ridimensionamento al suo interno, procedi nel seguente modo:
- Crea un MIG a livello di zona inviando una richiesta
POSTal metodoinstanceGroupManagers.insertcome segue.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di zona inviando una richiesta
POSTal metodoinstanceGroupManagerResizeRequests.insertcome segue:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Crea un MIG a livello di zona inviando una richiesta
- Per creare un gruppo di istanze gestite a livello di regione e una richiesta di ridimensionamento al suo interno, procedi nel seguente modo:
- Crea un gruppo di istanze gestite a livello di regione inviando una richiesta
POSTal metodoregionInstanceGroupManagers.insertcome segue.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Crea una richiesta di ridimensionamento nel gruppo di istanze gestite a livello di regione inviando una richiesta
POSTal metodobeta.regionInstanceGroupManagerResizeRequests.insertcome segue:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Crea un gruppo di istanze gestite a livello di regione inviando una richiesta
PROJECT_ID: l'ID progettoZONE: la zona in cui vuoi creare il gruppo di istanze gestite. Anche per un MIG a livello di regione, devi specificare una zona. Questa zona deve essere la zona che contiene il profilo per la tua rete VPC e deve essere una zona in cui è disponibile il tipo di macchina. Per ulteriori informazioni, vedi Limitazioni.REGION: la regione in cui vuoi creare il MIG.INSTANCE_TEMPLATE_URL: l'URL del template di istanza che vuoi utilizzare per creare le VM nel MIG. L'URL può contenere l'ID o il nome del modello di istanza. Specifica uno dei seguenti valori:- Per un template di istanza regionale:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Per un template di istanza globale:
INSTANCE_TEMPLATE_ID
- Per un template di istanza regionale:
MIG_NAME: il nome del MIG.WORKLOAD_POLICY_URL: (Facoltativo) l'URL del criterio del workload. Ad esempio,projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Se non vuoi utilizzare una policy del workload, rimuovi il camporesourcePolicies.workloadPolicy.RESIZE_REQUEST_NAME: il nome della richiesta di ridimensionamento, che deve essere univoco all'interno del gruppo di istanze gestite specificato. In caso contrario, la creazione della richiesta di ridimensionamento non va a buon fine.COUNT: il numero di VM da aggiungere contemporaneamente al MIG
Se il tuo workload richiede determinati nomi VM, puoi specificare un elenco
di nomi VM da creare. A tale scopo, invia una richiesta POST al
metodo beta.regionInstanceGroupManagerResizeRequests.insert
per un gruppo di istanze gestite a livello di regione o al
metodo beta.instanceGroupManagerResizeRequests.insert
per un gruppo di istanze gestite a livello di zona. Nel corpo della richiesta, sostituisci il campo resizeBy
con il
campo instanceNames.
Passaggi successivi
- Verifica il consumo della prenotazione
- Visualizza la topologia di un'istanza di computing
- Monitorare le VM
- Segnala un host difettoso
- Visualizzare, annullare o eliminare le richieste di ridimensionamento
- Risolvi i problemi relativi al consumo delle prenotazioni