Questo documento fornisce una panoramica delle VM con inizio flessibile, descrivendone le caratteristiche principali, nonché i requisiti e le limitazioni da applicare durante la creazione.
Le VM con inizio flessibile sono istanze di macchine virtuali (VM) che crei utilizzando il modello di provisioning con inizio flessibile. Questo modello utilizza il Dynamic Workload Scheduler (DWS) per eseguire il provisioning di risorse di computing scontate da un pool di capacità sicuro, migliorando le tue possibilità di ottenere risorse ad alta richiesta come le GPU. Dopo aver creato le VM con inizio flessibile, Compute Engine tenta di allocare le risorse richieste entro un periodo di tempo specifico. Se l'operazione va a buon fine, le VM con inizio flessibile iniziano a essere eseguite e continuano a essere eseguite per un massimo di sette giorni.
Per i workload che richiedono risorse per più di sette giorni o con una maggiore garanzia di capacità, puoi creare una richiesta di prenotazione futura in modalità calendario per usufruire comunque degli sconti DWS.
Casi d'uso delle VM con inizio flessibile
Le VM con inizio flessibile sono ideali per l'esecuzione di workload che possono essere avviati in qualsiasi momento, ad esempio:
Pre-addestramento di modelli di piccole dimensioni
Ottimizzazione dei modelli
Simulazione di computing ad alte prestazioni (HPC)
Inferenza batch
Caratteristiche principali delle VM con inizio flessibile
Rispetto ad altri tipi di istanze Compute Engine, le VM con inizio flessibile presentano le seguenti caratteristiche:
Tempo di attesa per l'allocazione delle risorse: puoi creare VM con inizio flessibile prima che Compute Engine possa allocare le risorse richieste. Tuttavia, le VM vengono avviate solo se le risorse diventano disponibili entro il periodo di tempo specificato. Se le risorse non sono disponibili, la richiesta di creazione della VM non va a buon fine.
Per ulteriori informazioni, consulta Tempo di attesa delle VM con inizio flessibile in questo documento.
Durata di esecuzione limitata: le VM con inizio flessibile vengono eseguite ininterrottamente per un massimo di sette giorni. Trascorso questo periodo di tempo, Compute Engine arresta o elimina automaticamente le VM in base all'azione di terminazione specificata nelle proprietà della VM.
Per ulteriori informazioni, consulta Durata di esecuzione limitata delle VM con inizio flessibile in questo documento.
Come Compute Engine alloca le VM: Compute Engine tenta di creare VM con inizio flessibile in prossimità per ridurre al minimo la latenza di rete. Per controllare il posizionamento delle VM con inizio flessibile, puoi utilizzare facoltativamente le policy di posizionamento compatto o le policy di workload.
Per ulteriori informazioni, consulta Flex-start VM in questo documento.
Modello di provisioning con inizio flessibile: crei VM con inizio flessibile utilizzando il modello di provisioning con inizio flessibile. Questo modello di provisioning offre una maggiore disponibilità di risorse e prezzi scontati rispetto alle VM create utilizzando il modello di provisioning standard.
Per ulteriori informazioni su ogni modello di provisioning, consulta Modelli di provisioning delle istanze Compute Engine.
Tempo di attesa delle VM con inizio flessibile
Quando crei una Flex-start VM, la VM non viene avviata immediatamente. Compute Engine tenta di allocare le risorse richieste e di avviare la VM entro un periodo di tempo specifico. Se hai una quota sufficiente per le risorse richieste e Compute Engine le alloca entro la fine del tempo di attesa, la VM con inizio flessibile viene avviata entro due minuti dalla disponibilità della capacità. In caso contrario, la richiesta di creazione della VM non va a buon fine.
Il tempo di attesa varia in base al metodo utilizzato per creare le VM:
Tempo di attesa delle VM con inizio flessibile autonome
Per creare una Flex-start VM autonoma, devi specificare un tempo di attesa utilizzando il campo requestValidForDuration. Puoi impostare un tempo di attesa di zero secondi o compreso tra 90 e 7200 secondi (due ore).
In base ai requisiti zonali del tuo workload, ti consigliamo i seguenti tempi di attesa per aumentare le probabilità di successo della richiesta di creazione della VM con inizio flessibile:
Requisiti zonali rigorosi: se il tuo workload richiede la creazione di una Flex-start VM in una zona specifica, ti consigliamo di impostare il campo
requestValidForDurationsu 90 secondi o più, fino a due ore. Tempi di attesa più lunghi aumentano le probabilità di ottenere risorse. Durante questo periodo di tempo, la VM rimane nello statoPENDINGNessun requisito zonale: se la VM con inizio flessibile può essere eseguita in qualsiasi zona della regione, ti consigliamo di impostare il campo
requestValidForDurationsu zero secondi. Questo valore specifica che Compute Engine alloca le risorse solo se sono immediatamente disponibili. Se la richiesta non va a buon fine perché le risorse non sono disponibili, prova a creare la Flex-start VM in un'altra zona.
Per interrompere una richiesta di creazione di VM mentre Compute Engine tenta di allocare le risorse, elimina la VM con inizio flessibile.
Tempo di attesa dei MIG con VM con inizio flessibile
Se aggiungi VM con inizio flessibile a un gruppo di istanze gestite (MIG), Compute Engine continua a tentare di eseguire il provisioning delle risorse richieste finché non riesce o non annulli la richiesta. Il modo in cui Compute Engine aggiunge le VM al MIG varia in base al metodo di creazione:
Richieste di ridimensionamento del MIG: Compute Engine aggiunge tutte le VM richieste a l MIG quando tutte le risorse diventano disponibili. A meno che tu non elimini le VM prima della fine della durata di esecuzione, Compute Engine le elimina contemporaneamente. Per ulteriori informazioni, consulta Informazioni sulle richieste di ridimensionamento del MIG.
MIG con una dimensione target: Compute Engine crea singolarmente ogni VM quando la capacità diventa disponibile. Pertanto, il MIG potrebbe inizialmente creare solo una parte delle VM richieste e poi aggiungere le VM rimanenti in un secondo momento, in base alla capacità. A meno che tu non elimini le VM prima della fine della durata di esecuzione, Compute Engine elimina ogni VM in base al proprio tempo di creazione. Per ulteriori informazioni, consulta Crea un MIG che utilizza VM con inizio flessibile.
Durata di esecuzione limitata delle VM con inizio flessibile
Quando crei una Flex-start VM, devi specificare quanto segue:
Durata di esecuzione della VM: devi specificare per quanto tempo le VM possono essere eseguite. La durata di esecuzione può essere di massimo sette giorni. Se il workload viene completato prima della fine della durata di esecuzione delle VM, puoi arrestare o eliminare le VM autonome oppure eliminare le VM in un MIG per evitare costi inutili.
Azione di terminazione della VM: devi scegliere se Compute Engine deve arrestare o eliminare automaticamente le VM al termine della durata di esecuzione. Per le VM con inizio flessibile in un MIG, puoi specificare solo l'eliminazione delle VM al termine della durata di esecuzione.
Allocazione delle VM con inizio flessibile
Compute Engine tenta di creare le VM con inizio flessibile in modo denso in base alla disponibilità. Questo posizionamento denso riduce al minimo gli hop di rete e ottimizza la latenza ridotta, ideale per i workload che richiedono una comunicazione costante tra le VM, come i workload di AI o ML. Se vuoi controllare il posizionamento delle VM con inizio flessibile per evitare che vengano create inaspettatamente a distanza, procedi nel seguente modo:
Per le VM con inizio flessibile autonome, applica una policy di posizionamento compatto alle VM.
Per i MIG con una dimensione target, applica una policy di workload con un tipo di throughput elevato al MIG.
Quota
Per creare o riavviare una VM con inizio flessibile, devi disporre di una quota preemptible sufficiente per le vCPU, la memoria e le GPU o i dischi SSD locali collegati richiesti.
Se tenti di creare o riavviare una Flex-start VM senza una quota sufficiente, si verifica una delle seguenti situazioni:
Richieste di creazione di VM: la richiesta rimane in sospeso finché non acquisisci una quota sufficiente. Se non acquisisci la quota richiesta prima della fine del tempo di attesa, la richiesta non va a buon fine.
Richieste di riavvio della VM: la richiesta non va a buon fine immediatamente.
Prezzi
Per le VM con inizio flessibile, sostieni addebiti come segue:
Paghi in base al consumo (PAYG). Per ulteriori informazioni sui prezzi di una VM durante il suo ciclo di vita, consulta Prezzi.
Per i tipi di macchine A4, A3, A2, G4 e H4D, ottieni vCPU, memoria e GPU collegate a un prezzo scontato. Altri tipi di macchine ottimizzate per l'acceleratore supportati non sono idonei per gli sconti. Per ulteriori informazioni, consulta i prezzi di DWS.
Limitazioni
Le sezioni seguenti descrivono le limitazioni per le VM con inizio flessibile.
Limitazioni per tutte le VM con inizio flessibile
Tutte le VM con inizio flessibile presentano le seguenti limitazioni:
Le VM con inizio flessibile possono utilizzare solo i seguenti tipi di macchine:
Devi creare VM con inizio flessibile utilizzando il modello di provisioning con inizio flessibile.
Devi specificare se arrestare o eliminare le VM con inizio flessibile al termine della durata di esecuzione utilizzando i
instanceTerminationActionemaxRunDurationcampi. Per i MIG, puoi specificare solo l'eliminazione delle VM con inizio flessibile.Devi arrestare le VM con inizio flessibile durante gli eventi di manutenzione dell'host.
Puoi applicare policy di posizionamento compatto solo alle VM con inizio flessibile autonome.
Non puoi applicare policy di posizionamento distribuito alle VM con inizio flessibile.
Non puoi creare prenotazioni.
Limitazioni per i MIG con VM con inizio flessibile
Tutti i MIG con VM con inizio flessibile presentano le seguenti limitazioni:
Devi disattivare le riparazioni nel MIG.
Devi eliminare la configurazione della scalabilità automatica.
Puoi creare VM con inizio flessibile nei MIG a livello di regione solo utilizzando le seguenti forme di distribuzione target:
Per i MIG con una dimensione target:
ANYoANY_SINGLE_ZONEPer le richieste di ridimensionamento del MIG:
ANY_SINGLE_ZONE
Puoi impostare la modalità pool di standby del MIG su
manual(predefinita).Non puoi aggiungere un secondo template di istanza per avviare un aggiornamento canary nel MIG.
Inoltre, se vuoi creare VM con inizio flessibile utilizzando le richieste di ridimensionamento del MIG, consulta le limitazioni per le richieste di ridimensionamento del MIG.
Passaggi successivi
Per scoprire come creare Flex-start VM autonome, consulta Crea una Flex-start VM.
Per scoprire come creare VM con inizio flessibile in un MIG, consulta:
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Compute Engine in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
Fai una prova senza costi di Compute Engine