Informazioni sulla flessibilità delle istanze per le VM create in blocco

Questo documento descrive la flessibilità delle istanze durante la creazione di VM in blocco utilizzando Compute Engine.

Quando crei più macchine virtuali (VM) contemporaneamente in una regione, se la tua applicazione non è limitata a un singolo tipo di macchina, puoi aumentare la percentuale di successo del provisioning del numero di VM richiesto configurando la flessibilità delle istanze. La flessibilità delle istanze ti consente di specificare uno o più tipi di macchine adatti al tuo workload. Compute Engine esegue il provisioning delle VM utilizzando uno di questi tipi di macchine, in base alla capacità e alla disponibilità della quota.

Utilizzare la flessibilità delle istanze

Per configurare la flessibilità delle istanze, elenca i tipi di macchine adatti definendo una o più selezioni di istanze nella richiesta di inserimento collettivo regionale. Ad esempio, in una richiesta REST, includi l'oggetto instanceFlexibilityPolicy, all'interno del quale definisci uno o più oggetti instanceSelections, ognuno contenente un elenco di tipi di macchine.

Quando Compute Engine riceve la richiesta, convalida prima i tipi di macchine e la loro compatibilità zonale, escludendo eventuali voci non valide. Se esiste almeno una configurazione valida, l'operazione continua.

Compute Engine tenta quindi di eseguire il provisioning delle VM in base a hardware, quota e prenotazioni disponibili. Se configuri i ranking per le selezioni della tua istanza, assegna la priorità alle selezioni con un ranking inferiore. All'interno di ogni rango, Compute Engine prende in considerazione le prenotazioni inutilizzate e le indicazioni per le VM spot per selezionare i tipi di macchine con una probabilità di prerilascio inferiore.

Selezione della zona quando viene definita una forma di distribuzione target

Quando utilizzi la flessibilità delle istanze con una richiesta bulkInsert a livello di regione, puoi specificare una forma di distribuzione target per controllare la modalità di distribuzione delle VM nelle zone della regione. Compute Engine seleziona le zone per il provisioning delle VM in base a questa forma, nel seguente modo:

  • ANY_SINGLE_ZONE: Compute Engine seleziona una singola zona con la maggiore capacità per i tipi di macchine con una preferenza più elevata.
  • BALANCED: Compute Engine distribuisce le VM nel modo più uniforme possibile tra le zone con risorse disponibili. All'interno di ogni zona, Compute Engine dà la priorità ai tipi di macchine con una preferenza più alta.
  • ANY: Compute Engine seleziona le zone con risorse disponibili. Se i ranking sono configurati, Compute Engine dà la priorità alle zone per il provisioning delle VM con tipi di macchine con una preferenza più alta.

Per saperne di più, consulta Crea più VM contemporaneamente in una regione.

Provisioning minimo di VM e flessibilità delle istanze

Se definisci un valore per il numero minimo richiesto di VM (minCount) nella richiesta bulkInsert, l'API tenta di creare almeno quel numero di VM. Se Compute Engine non riesce a eseguire il provisioning del numero minimo richiesto di VM (minCount), l'intera operazione non va a buon fine e Compute Engine non crea alcuna VM. Quando utilizzi minCount con la flessibilità delle istanze, Compute Engine assegna la priorità al provisioning delle VM in base alla disponibilità rispetto al ranking, come segue:

  • Compute Engine assegna la priorità al provisioning del numero massimo di VM fino a count, anche se ciò significa utilizzare macchine con una preferenza inferiore. Ad esempio, se la tua richiesta specifica un minimo di una VM richiesta (minCount=1) e un massimo di 10 VM (count=10) e se Compute Engine ha la capacità di eseguire il provisioning di una VM con preferenza più alta o di sei VM con preferenza più bassa, Compute Engine esegue il provisioning delle sei VM con preferenza più bassa.
  • Se Compute Engine può eseguire il provisioning dello stesso numero massimo di VM fino a count utilizzando selezioni di istanze diverse, assegna la priorità alla selezione con preferenza più elevata. Ad esempio, se la tua richiesta specifica un minimo di una VM richiesta (minCount=1) e un massimo di 10 VM (count=10) e se Compute Engine può eseguire il provisioning di sei VM utilizzando una selezione di istanze con preferenza più alta o più bassa, Compute Engine esegue il provisioning delle sei VM dalla selezione con preferenza più alta.

Per saperne di più, vedi la proprietà minCount in bulkInsert.

Scenari di convalida e di errore dell'inserimento collettivo

Compute Engine esegue una convalida iniziale dei tipi di macchine e della loro compatibilità zonale, escludendo eventuali voci non valide. Se dopo questo controllo iniziale rimane almeno una configurazione valida, Compute Engine procede con la creazione della VM.

Tuttavia, alcune convalide della configurazione possono essere eseguite solo dopo che Compute Engine ha selezionato le zone e i tipi di macchine da utilizzare per il provisioning, in base alle norme di flessibilità delle istanze e alla capacità disponibile. Se, durante questa fase di convalida successiva, la combinazione specifica di tipo di macchina e zona scelta per il provisioning risulta non valida, l'intera richiesta di inserimento collettivo non va a buon fine e vengono restituiti errori di convalida. Questo errore può verificarsi anche se altre configurazioni all'interno di instanceFlexibilityPolicy erano inizialmente valide.

Limitazioni

Quando utilizzi la flessibilità delle istanze per la creazione di VM in blocco, si applicano le seguenti limitazioni:

  • Puoi specificare la flessibilità delle istanze solo per le richieste bulkInsert regionali; non puoi utilizzarla con le richieste zonali.
  • La flessibilità delle istanze non supporta le funzionalità di AI Hypercomputer, tra cui le prenotazioni future, il modello di provisioning con avvio flessibile e le GPU A3 Ultra, A4 e più recenti.
  • Non puoi specificare tipi di macchine personalizzate con la flessibilità delle istanze.
  • Puoi specificare un massimo di 10 tipi di macchine diversi in un massimo di 10 selezioni di istanze diverse.

Passaggi successivi