Modelli di provisioning delle istanze Compute Engine

Questo documento descrive i modelli di provisioning per le istanze Compute Engine. Per scoprire di più sulle opzioni di deployment, consulta Scegli una strategia di deployment di Compute Engine per il tuo workload.

I modelli di provisioning determinano la disponibilità, la durata e i prezzi delle istanze. Se comprendi questi modelli, puoi scegliere l'opzione migliore per il tuo workload.

Modelli di provisioning disponibili

Quando crei un'istanza di computing, puoi specificare uno dei seguenti modelli di provisioning. Se non specifichi un modello di provisioning, Compute Engine utilizza per impostazione predefinita il modello di provisioning standard.

  • Standard

  • Spot

  • Avvio flessibile

  • Con prenotazione

La tabella seguente consente di mettere a confronto i casi d'uso e i prezzi di ciascun modello di provisioning:

Standard Spot Avvio flessibile Con prenotazione
Riepilogo
  • In base alla disponibilità delle risorse puoi creare immediatamente le istanze.
  • Puoi controllare quando arrestare o eliminare le istanze.
  • In base alla disponibilità delle risorse puoi creare immediatamente le istanze.
  • Puoi controllare quando arrestare o eliminare le istanze. Tuttavia, consenti anche a Compute Engine di arrestare o eliminare le istanze in qualsiasi momento per recuperare la capacità.
  • Dopo aver creato un gruppo di istanze gestite (MIG) a livello di zona, richiedi a Compute Engine di aggiungere istanze con GPU collegate al MIG. Compute Engine pianifica il provisioning delle istanze in base alla disponibilità delle risorse.
  • Puoi controllare quando eliminare le istanze. Tuttavia, non puoi interromperli, sospenderli o ricrearli. Le istanze vengono eseguite per un massimo di sette giorni. Poi, Compute Engine li elimina.
  • Puoi richiedere di prenotare la capacità in una data futura per creare istanze con GPU collegate. Se Google Cloud approva la richiesta, Compute Engine crea una prenotazione. All'inizio del periodo di prenotazione, puoi utilizzare la prenotazione creando istanze GPU corrispondenti alla prenotazione.
  • Durante il periodo di prenotazione approvato, puoi arrestare, riavviare, eliminare e ricreare istanze per utilizzare la prenotazione in base alle tue esigenze. Al termine del periodo di prenotazione, Compute Engine elimina la prenotazione e arresta o elimina le eventuali istanze che la utilizzano.
Casi d'uso

Ideale per i workload che richiedono stabilità e funzionamento continuo, ad esempio:

  • Server web
  • Database
  • Applicazioni aziendali
  • Sviluppo e test

Ideale per i workload che possono tollerare interruzioni, ad esempio:

  • Elaborazione dei dati in modalità batch
  • Computing ad alte prestazioni (HPC)
  • Integrazione e il deployment continui (CI/CD)
  • Analisi di dati
  • Codifica dei contenuti multimediali
  • Inferenza online

Workload che richiedono stabilità e devono essere eseguiti per non più di sette giorni, ad esempio i seguenti workload:

  • Pre-addestramento di modelli di piccole dimensioni
  • Ottimizzazione del modello
  • Simulazione HPC
  • Inferenza batch

Ideale per i workload che richiedono stabilità e un tempo di esecuzione specifico, ad esempio:

  • Per i workload che durano fino a 90 giorni:

    • Job di pre-addestramento dei modelli
    • Job di ottimizzazione dei modelli
    • Workload di simulazione HPC
    • Aumenti dei workload di inferenza previsti nel breve termine
  • Per i workload più lunghi di 90 giorni:

    • Workload di addestramento
    • Workload di inferenza
Prezzi
  • Ti vengono addebitati i prezzi standard per le istanze. Consulta Prezzi delle istanze VM.
  • Ti vengono addebitati i costi in base al metodo che utilizzi per creare le istanze:

    • Se crei immediatamente istanze, paghi a consumo (PAYG).
    • Se crei istanze utilizzando una prenotazione on demand o una prenotazione creata automaticamente per una prenotazione futura, ti vengono addebitati costi finché la prenotazione esiste. Per ulteriori informazioni, vedi Fatturazione delle prenotazioni.
  • Ottieni sconti tra il 60% e il 91% per la maggior parte delle vCPU, della memoria e delle GPU. Inoltre, puoi beneficiare di sconti più piccoli per qualsiasi tipo di macchina A4 o A3 e GPU, dischi SSD locali, indirizzi IP esterni e costi di rete di livello 1. Per ulteriori informazioni, consulta Prezzi delle VM spot.
  • Utilizzi il pagamento a consumo.
  • In base alla serie di macchine utilizzata dalle tue istanze, ottieni uno sconto come segue:

    • Per le serie di macchine A4, A3 e A2, ottieni uno sconto del 53% per vCPU, memoria e GPU.
    • Per la serie di macchine H4D, ottieni uno sconto del 25% per vCPU e memoria.
    Le altre serie di macchine supportate non sono idonee per gli sconti. Per ulteriori informazioni, vedi Prezzi di Dynamic Workload Scheduler (DWS).
  • Utilizzi il pagamento a consumo.
Quota Quando crei un'istanza, viene utilizzata la quota standard. Quando crei un'istanza, viene utilizzata la quota preemptible. Se il progetto non dispone di quota preassegnata, viene utilizzata la quota standard. I Google Cloud crediti del Livello gratuito non si applicano alle VM spot. Quando il MIG aggiunge istanze al gruppo, viene utilizzata la quota preemptible. Se il progetto non dispone di quota preassegnata, viene utilizzata la quota standard. La quota non si applica al modello di provisioning con prenotazione.

Disponibilità e durata delle istanze

La tabella seguente mostra la disponibilità e la durata delle istanze di computing per ogni modello di provisioning:

Standard Spot Avvio flessibile Con prenotazione
Prerequisiti per la creazione Nessun prerequisito per la creazione. Nessun prerequisito per la creazione. Nessun prerequisito per la creazione.

Per creare istanze, devi prima prenotare la capacità utilizzando uno dei seguenti metodi:

Alla data e all'ora di consegna scelte, Compute Engine esegue il provisioning della capacità richiesta. Quindi, puoi utilizzare la capacità creando istanze.

Serie di macchine supportate Puoi utilizzare qualsiasi serie di macchine, ad eccezione di A4X, A4 e A3 Ultra. Puoi utilizzare qualsiasi serie di macchine, ad eccezione di A4X, G4, X4 e istanze bare metal.

Puoi utilizzare solo le seguenti serie di macchine:

A seconda di come prenoti la capacità per creare VM, puoi utilizzare solo le seguenti serie di macchine:

Disponibilità delle istanze Puoi creare istanze in qualsiasi momento, a condizione che le risorse richieste siano disponibili. Puoi creare istanze in qualsiasi momento, a condizione che le risorse richieste siano disponibili.

Puoi creare istanze nel seguente modo:

Compute Engine utilizza DWS per pianificare il provisioning della capacità richiesta in base alla disponibilità delle risorse. DWS ti aiuta a ottenere risorse ad alta richiesta come le GPU.

Puoi creare istanze solo dopo aver prenotato la capacità per una data futura. Alla data della richiesta, Compute Engine fornisce la capacità desiderata, che puoi utilizzare per creare istanze. Se prenoti risorse utilizzando le prenotazioni future in modalità calendario, Compute Engine utilizza DWS per eseguire il provisioning della capacità richiesta. DWS ti aiuta a ottenere risorse ad alta richiesta come le GPU.
Garanzia di capacità In base al metodo di creazione. La garanzia di capacità varia in base al metodo utilizzato per creare le istanze nel seguente modo:
  • Se crei immediatamente le istanze, Compute Engine tenta di eseguire il provisioning della capacità richiesta.
  • Se crei istanze utilizzando una prenotazione on demand o una prenotazione creata automaticamente per una prenotazione futura, hai la certezza che Compute Engine esegua il provisioning della capacità richiesta se la prenotazione ha capacità riservata disponibile.
Best effort. Quando crei VM spot, Compute Engine tenta di eseguire il provisioning della capacità richiesta nel miglior modo possibile. Best effort. Quando crei una richiesta di ridimensionamento del MIG, Compute Engine tenta in ogni modo di pianificare il provisioning della capacità richiesta. Molto alto. Se Google Cloud approva la tua richiesta di prenotazione, hai la certezza che Compute Engine esegue il provisioning della capacità prenotata alla data e all'ora di consegna che hai scelto. Hai accesso esclusivo alla capacità riservata per il periodo di prenotazione.
Durata dell'istanza Puoi controllare quando arrestare o eliminare un'istanza. Tuttavia, se il tipo di macchina utilizzato dall'istanza non supporta la migrazione live, Compute Engine arresta l'istanza durante gli eventi di manutenzione dell'host.

Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:

  • Compute Engine arresta o elimina l'istanza per recuperare capacità. Questo processo è chiamato prerilascio.
  • Se il tipo di macchina utilizzato dall'istanza non supporta la migrazione live, Compute Engine arresta l'istanza durante gli eventi di manutenzione dell'host.

Prima che un'istanza raggiunga la fine della durata di esecuzione, puoi eseguire le seguenti operazioni:

  • Arresta l'istanza: puoi arrestare l'istanza in qualsiasi momento solo se è stata creata come istanza autonoma.
  • Elimina l'istanza: puoi eliminare l'istanza in qualsiasi momento.

Quando un'istanza raggiunge la fine della durata di esecuzione, Compute Engine la elimina.

Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:

  • Compute Engine arresta l'istanza durante gli eventi di manutenzione dell'host.
  • La prenotazione creata automaticamente per eseguire il provisioning della capacità richiesta raggiunge la fine del periodo di impegno di prenotazione. A quel punto, Compute Engine elimina la prenotazione e arresta o elimina le eventuali istanze che la utilizzano in base all' azione di terminazione specificata nella loro configurazione.

Passaggi successivi