Questo documento descrive i modelli di provisioning per le istanze Compute Engine.
Quando crei un'istanza, devi definire il metodo, chiamato modello di provisioning, che vuoi utilizzare per ottenere le risorse richieste. Ogni modello di provisioning determina la disponibilità, la durata e i prezzi delle istanze. Comprendendo questi modelli, puoi scegliere l'opzione migliore per il tuo workload.
Modelli di provisioning disponibili
Quando crei un'istanza di computing, puoi specificare uno dei seguenti modelli di provisioning. Se non specifichi un modello di provisioning, Compute Engine utilizza per impostazione predefinita il modello di provisioning standard.
Standard
Spot
Avvio flessibile
Con prenotazione
La tabella seguente consente di mettere a confronto i casi d'uso e i prezzi di ciascun modello di provisioning:
| Standard | Spot | Avvio flessibile | Con prenotazione | |
|---|---|---|---|---|
| Riepilogo |
|
|
|
|
| Casi d'uso |
Ideale per i workload che richiedono stabilità e funzionamento continuo, ad esempio:
|
Ideale per i workload che possono tollerare interruzioni, ad esempio:
|
Workload che richiedono stabilità e devono essere eseguiti per non più di sette giorni, ad esempio:
|
Ideale per i workload che richiedono stabilità e un tempo di esecuzione specifico, ad esempio:
|
| Prezzi |
|
|
|
|
| Quota | Quando crei un'istanza, viene utilizzata la quota standard. | Quando crei un'istanza, viene utilizzata la quota preemptible. Se il progetto non dispone di quota preassegnata, viene utilizzata la quota standard. I Google Cloud crediti del Livello gratuito non si applicano alle VM spot. | Quando il MIG aggiunge istanze al gruppo, viene utilizzata la quota preemptible. Se il progetto non dispone di quota preassegnata, viene utilizzata la quota standard. | La quota non si applica al modello di provisioning con prenotazione. |
Disponibilità e durata delle istanze
La tabella seguente mostra la disponibilità e la durata delle istanze di computing per ogni modello di provisioning:
| Standard | Spot | Avvio flessibile | Con prenotazione | |
|---|---|---|---|---|
| Prerequisiti per la creazione | Nessun prerequisito per la creazione. | Nessun prerequisito per la creazione. | Nessun prerequisito per la creazione. |
Per creare istanze, devi prima prenotare la capacità utilizzando uno dei seguenti metodi:
Alla data e all'ora di consegna scelte, Compute Engine esegue il provisioning della capacità richiesta. Quindi, puoi utilizzare la capacità creando istanze. |
| Serie di macchine supportate | Puoi utilizzare qualsiasi serie di macchine, ad eccezione di A4X, A4 e A3 Ultra. | Puoi utilizzare qualsiasi serie di macchine, ad eccezione di A4X, X4 e istanze bare metal. |
Puoi utilizzare solo le seguenti serie di macchine: |
A seconda di come prenoti la capacità per creare VM, puoi utilizzare solo le seguenti serie di macchine:
|
| Disponibilità delle istanze | Puoi creare istanze in qualsiasi momento, a condizione che le risorse richieste siano disponibili. | Puoi creare istanze in qualsiasi momento, a condizione che le risorse richieste siano disponibili. | Puoi creare istanze nel seguente modo: Compute Engine utilizza DWS per pianificare il provisioning della capacità richiesta in base alla disponibilità delle risorse. DWS ti aiuta a ottenere risorse ad alta richiesta come le GPU. |
Puoi creare istanze solo dopo aver prenotato la capacità per una data futura. Alla data della richiesta, Compute Engine fornisce la capacità desiderata, che puoi utilizzare per creare istanze. Se prenoti risorse utilizzando le prenotazioni future in modalità calendario, Compute Engine utilizza DWS per eseguire il provisioning della capacità richiesta. DWS ti aiuta a ottenere risorse ad alta richiesta come le GPU. |
| Garanzia di capacità | In base al metodo di creazione. La garanzia di capacità
varia in base al metodo utilizzato per creare le istanze nel seguente modo:
|
Best effort. Quando crei VM spot, Compute Engine fa del suo meglio per eseguire il provisioning della capacità richiesta. | Best effort. Quando crei una richiesta di ridimensionamento del MIG, Compute Engine tenta al meglio di pianificare il provisioning della capacità richiesta. | Molto alto. Se Google Cloud approva la tua richiesta di prenotazione, hai la certezza che Compute Engine esegue il provisioning della capacità prenotata alla data e all'ora di consegna che hai scelto. Hai accesso esclusivo alla capacità riservata per il periodo di prenotazione. |
| Durata dell'istanza | Puoi controllare quando arrestare o eliminare un'istanza. Tuttavia, se il tipo di macchina utilizzato dall'istanza non supporta la migrazione live, Compute Engine arresta l'istanza durante gli eventi di manutenzione dell'host. |
Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:
|
Prima che un'istanza raggiunga la fine della durata di esecuzione, puoi eseguire le seguenti operazioni:
Quando un'istanza raggiunge la fine della durata di esecuzione, Compute Engine la elimina. |
Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:
|
Modelli di provisioning per i deployment densi
Per eseguire il deployment di workload di computing ad alte prestazioni (HPC), intelligenza artificiale (AI) e machine learning (ML) su Google Cloud, le risorse di calcolo devono essere fisicamente vicine tra loro per ridurre al minimo gli hop di rete e ottimizzare per la latenza più bassa. Compute Engine fornisce metodi di provisioning che consentono di prenotare gruppi di host strettamente accoppiati interconnessi da un fabric di rete ad alta velocità all'interno di un singolo data center.
Per saperne di più sui metodi di provisioning per le implementazioni dense, consulta le seguenti risorse:
- Istanze H4D: Panoramica della creazione di cluster HPC
- Istanze GPU: Panoramica della capacità nella documentazione di AI Hypercomputer.
Passaggi successivi
Consulta una panoramica della creazione di istanze Compute Engine.
Scopri di più sulle VM spot.
Scopri di più sulle VM con avvio flessibile.
Scopri di più sulle VM che utilizzano il modello di provisioning vincolato alla prenotazione.