Modelli di provisioning delle istanze Compute Engine

Quando crei un'istanza Compute Engine, devi definire il metodo, chiamato modello di provisioning, che vuoi utilizzare per ottenere le risorse richieste. Ogni modello di provisioning determina la disponibilità, la durata e i prezzi delle istanze di computing.

Questo documento spiega i diversi modelli di provisioning che puoi specificare quando crei istanze di computing. Comprendendo questi modelli, puoi scegliere l'opzione migliore per il tuo workload.

Modelli di provisioning disponibili

Quando crei un'istanza di computing, puoi specificare uno dei seguenti modelli di provisioning. Se non specifichi un modello di provisioning, Compute Engine utilizza per impostazione predefinita il modello di provisioning standard.

  • Standard

  • Spot

  • Avvio flessibile

  • Con prenotazione

La tabella seguente consente di mettere a confronto i casi d'uso e i prezzi di ciascun modello di provisioning:

Standard Spot Avvio flessibile Con prenotazione
Riepilogo
  • In base alla disponibilità delle risorse, puoi creare immediatamente istanze di computing.
  • Puoi controllare quando arrestare o eliminare le istanze di computing.
  • In base alla disponibilità delle risorse, puoi creare immediatamente istanze di computing.
  • Puoi controllare quando arrestare o eliminare le istanze di computing. Tuttavia, consenti anche a Compute Engine di arrestare o eliminare le istanze di computing in qualsiasi momento per recuperare la capacità.
  • In base alla disponibilità delle risorse, puoi creare istanze di computing entro un tempo di attesa specificato. Per una Flex-start VM autonoma, puoi specificare un tempo di attesa massimo di due ore. Per una richiesta di ridimensionamento del MIG, il tempo di attesa è indefinito.
  • Puoi controllare quando arrestare o eliminare le istanze di computing. Tuttavia, non puoi sospenderle o ricrearle. Le istanze di computing vengono eseguite per un minimo di 10 minuti e un massimo di sette giorni. Quando le istanze di computing raggiungono la fine della durata di esecuzione, Compute Engine le arresta o le elimina in base all'azione di terminazione.
  • Puoi richiedere di prenotare la capacità in una data futura per creare istanze di computing. Se Google Cloud approva la richiesta, allora Compute Engine crea una prenotazione. All'inizio del periodo di prenotazione, puoi utilizzare la prenotazione creando istanze di computing corrispondenti alla prenotazione.
  • Durante il periodo di prenotazione approvato, puoi arrestare, riavviare, eliminare e ricreare istanze di computing per utilizzare la prenotazione in base alle tue esigenze. Al termine del periodo di prenotazione, Compute Engine elimina la prenotazione e arresta o elimina le eventuali istanze di computing che utilizzano la prenotazione in base all'azione di terminazione.
Casi d'uso

Ideale per i workload che richiedono stabilità e funzionamento continuo, ad esempio i seguenti workload:

  • Server web
  • Database
  • Applicazioni aziendali
  • Sviluppo e test

Ideale per i workload che possono tollerare interruzioni, ad esempio i seguenti workload:

  • Elaborazione batch
  • Computing ad alte prestazioni (HPC)
  • Integrazione e il deployment continui (CI/CD)
  • Analisi di dati
  • Codifica dei contenuti multimediali
  • Inferenza online

Workload che richiedono stabilità e devono essere eseguiti per non più di sette giorni, ad esempio i seguenti workload:

  • Pre-addestramento di modelli di piccole dimensioni
  • Ottimizzazione dei modelli
  • Simulazione HPC
  • Inferenza batch

Ideale per i workload che richiedono stabilità e un tempo di esecuzione specifico, ad esempio:

  • Per i workload che durano fino a 90 giorni:

    • Job di pre-addestramento dei modelli
    • Job di ottimizzazione dei modelli
    • Workload di simulazione HPC
    • Aumenti dei workload di inferenza previsti nel breve termine
  • Per i workload di durata superiore a 90 giorni:

    • Workload di addestramento
    • Workload di inferenza
Allocazione delle risorse Best-effort. Compute Engine posiziona fisicamente risorse vicine tra loro in base al principio del best-effort. Per controllare il posizionamento, puoi utilizzare facoltativamente le policy di posizionamento. Best-effort. Compute Engine posiziona fisicamente risorse vicine tra loro in base al principio del best-effort. Per controllare il posizionamento, puoi utilizzare facoltativamente le policy di posizionamento.

L'allocazione delle risorse varia in base alla modalità di creazione delle istanze di computing:

  • Best-effort. Se crei VM con avvio flessibile autonome, Compute Engine posiziona fisicamente le risorse vicine tra loro in base al principio del best-effort. Per controllare il posizionamento, puoi utilizzare facoltativamente le policy di posizionamento.
  • Dense. Se crei VM con avvio flessibile tramite richieste di ridimensionamento del MIG, Compute Engine posiziona fisicamente le risorse su host strettamente accoppiati collegati da un'infrastruttura di rete ad alta velocità per ridurre al minimo la latenza di rete.
Dense. Compute Engine posiziona fisicamente le risorse su host strettamente accoppiati collegati da un'infrastruttura di rete ad alta velocità per ridurre al minimo la latenza di rete.
Prezzi
  • Ti vengono addebitati i prezzi standard per le istanze di computing. Consulta Prezzi delle istanze VM.
  • Ti vengono addebitati costi in base al metodo utilizzato per creare le istanze di computing:

    • Se crei immediatamente istanze di computing, paghi in base al consumo (PAYG).
    • Se crei istanze di computing utilizzando una prenotazione on demand prenotazione o una prenotazione creata automaticamente per una prenotazione futura prenotazione, ti vengono addebitati costi fino a quando la prenotazione esiste. Per ulteriori informazioni, consulta Fatturazione delle prenotazioni.
  • Puoi ottenere sconti fino al 91% per molti tipi di macchine, GPU, TPU e dischi SSD locali. Per ulteriori informazioni, consulta Prezzi delle VM spot.
  • Paghi in base al consumo (PAYG).
  • In base alla serie di macchine utilizzata dalle istanze di computing, puoi ottenere uno sconto come segue:

    • Per le serie di macchine A4, A3 e A2, puoi ottenere uno sconto del 53% per vCPU, memoria e GPU.
    • Per la serie di macchine H4D, puoi ottenere uno sconto del 25% per vCPU e memoria.
    Le altre serie di macchine supportate non sono idonee per gli sconti. Per ulteriori informazioni, consulta Prezzi di Dynamic Workload Scheduler (DWS).
  • Paghi in base al consumo (PAYG).
Quota Quando crei un'istanza di computing, viene utilizzata la quota standard. Quando crei una VM spot, viene utilizzata la quota preemptible . Se il progetto non dispone di quota preassegnata, viene utilizzata la quota standard quota. Google Cloud I crediti del Livello senza costi non si applicano alle VM spot. Quando crei una Flex-start VM, la quota preemptible viene utilizzata. Se il progetto non dispone di quota preassegnata, viene utilizzata la quota standard quota.

Il consumo di quota varia in base al metodo utilizzato per prenotare le risorse:

  • Prenotazioni future con AI Hypercomputer o cluster HPC: Google gestisce la quota per le risorse prenotate. Non è necessario richiedere manualmente la quota. All'ora di inizio della prenotazione futura approvata, Google aumenta automaticamente la quota se il progetto non ne dispone.
  • Prenotazioni future in modalità calendario: per prenotare i tipi di macchine H4D, la quota CPU viene utilizzata. Per prenotare i tipi di macchine GPU o TPU, quota non è richiesta alcuna quota.

Disponibilità e durata delle istanze di computing

La tabella seguente mostra la disponibilità e la durata delle istanze di computing per ogni modello di provisioning:

Standard Spot Avvio flessibile Con prenotazione
Prerequisiti per la creazione Nessun prerequisito per la creazione. Nessun prerequisito per la creazione. Nessun prerequisito per la creazione.

Per creare istanze di computing, devi prima prenotare la capacità utilizzando uno dei seguenti metodi:

Alla data e all'ora di consegna scelte, Compute Engine esegue il provisioning della capacità richiesta. Quindi, puoi utilizzare la capacità creando istanze di computing.

Serie di macchine supportate Puoi utilizzare qualsiasi serie di macchine, ad eccezione di A4X Max, A4X, A4 e A3 Ultra. Puoi utilizzare qualsiasi serie di macchine, ad eccezione delle istanze A4X e di tutte le istanze bare metal (A4X Max, C4D, C4, C3, X4 e Z3).

Puoi utilizzare solo le seguenti serie di macchine:

A seconda di come prenoti la capacità per creare VM, puoi utilizzare solo le seguenti serie di macchine:

Disponibilità delle istanze di computing Puoi creare istanze di computing in qualsiasi momento, a condizione che le tue risorse richieste siano disponibili. Puoi creare istanze di computing in qualsiasi momento, a condizione che le tue risorse richieste siano disponibili.

Puoi creare istanze di computing come segue:

Compute Engine uses DWS per pianificare il provisioning della capacità richiesta in base alla disponibilità delle risorse. DWS ti aiuta a ottenere risorse molto richieste come le GPU.

Puoi creare istanze di computing solo dopo aver prenotato la capacità per una data futura. Alla data della richiesta, Compute Engine fornisce la capacità desiderata, che puoi utilizzare per creare istanze di computing Se prenoti le risorse utilizzando le prenotazioni future in modalità calendario, Compute Engine utilizza DWS per eseguire il provisioning della capacità richiesta. DWS ti aiuta a ottenere risorse molto richieste come le GPU.
Garanzia di capacità In base al metodo di creazione. La garanzia di capacità varia in base al metodo utilizzato per creare le istanze di computing, come segue:
  • Se crei immediatamente istanze di computing, Compute Engine tenta di eseguire il provisioning della capacità richiesta in base al principio del best-effort.
  • Se crei istanze di computing utilizzando una prenotazione on demand o una prenotazione creata automaticamente per una prenotazione futura, hai una garanzia molto elevata che Compute Engine esegua il provisioning della capacità richiesta se la prenotazione ha capacità riservata disponibile.
Best-effort. Quando crei VM spot, Compute Engine tenta di eseguire il provisioning della capacità richiesta in base al principio del best-effort. Best-effort. Quando crei una richiesta di ridimensionamento del MIG, Compute Engine tenta di pianificare il provisioning della capacità richiesta in base al principio del best-effort. Molto elevata. Se Google Cloud approva la tua richiesta di prenotazione, hai una garanzia molto elevata che Compute Engine esegua il provisioning della capacità riservata alla data e all'ora di consegna scelte. Hai accesso esclusivo alla capacità riservata per il periodo di prenotazione.
Durata delle istanze di computing Puoi controllare quando arrestare o eliminare un'istanza di computing. Tuttavia, se il tipo di macchina utilizzato dall'istanza di computing non supporta la migrazione live, Compute Engine arresta l'istanza di computing durante gli eventi di manutenzione dell'host.

Puoi controllare quando arrestare o eliminare un'istanza di computing, tranne nei seguenti casi:

  • Compute Engine arresta o elimina l'istanza di computing per recuperare la capacità. Questo processo è chiamato prerilascio.
  • Se il tipo di macchina utilizzato dall'istanza di computing non supporta la migrazione live, Compute Engine arresta l'istanza di computing durante gli eventi di manutenzione dell'host.

Prima che un'istanza di computing raggiunga la fine della durata di esecuzione, puoi eseguire le seguenti operazioni:

  • Arresta l'istanza di computing: puoi arrestare l'istanza di computing in qualsiasi momento solo se è stata creata come istanza di computing autonoma.
  • Elimina l'istanza di computing: puoi eliminare l' istanza di computing in qualsiasi momento.

Quando un'istanza di computing raggiunge la fine della durata di esecuzione, Compute Engine la elimina.

Puoi controllare quando arrestare o eliminare un'istanza di computing, tranne nei seguenti casi:

  • Compute Engine arresta l'istanza di computing durante gli eventi di manutenzione dell'host.
  • La prenotazione creata automaticamente per eseguire il provisioning della capacità richiesta raggiunge la fine del periodo di impegno di prenotazione. A quel punto, Compute Engine elimina la prenotazione e arresta o elimina le eventuali istanze di computing che utilizzano la prenotazione in base all' azione di terminazione specificata nella configurazione.

Passaggi successivi