Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelli di provisioning delle istanze Compute Engine

Linux Windows

Quando crei un'istanza Compute Engine, devi definire il metodo, chiamato modello di provisioning, che vuoi utilizzare per ottenere le risorse richieste. Ogni modello di provisioning determina la disponibilità, la durata e i prezzi delle istanze di computing.

Questo documento spiega i diversi modelli di provisioning che puoi specificare quando crei istanze di calcolo. Comprendendo questi modelli, puoi scegliere l'opzione migliore per il tuo workload.

Modelli di provisioning disponibili

Quando crei un'istanza di computing, puoi specificare uno dei seguenti modelli di provisioning. Se non specifichi un modello di provisioning, Compute Engine utilizza per impostazione predefinita il modello di provisioning standard.

Standard
Spot
Avvio flessibile
Con prenotazione

La tabella seguente consente di mettere a confronto i casi d'uso e i prezzi di ciascun modello di provisioning:

	Standard	Spot	Avvio flessibile	Con prenotazione
Riepilogo	In base alla disponibilità delle risorse, puoi creare immediatamente istanze di calcolo. Puoi controllare quando arrestare o eliminare le istanze di calcolo.	In base alla disponibilità delle risorse, puoi creare immediatamente istanze di calcolo. Puoi controllare quando arrestare o eliminare le istanze di calcolo. Tuttavia, consenti anche a Compute Engine di arrestare o eliminare le istanze di computing in qualsiasi momento per recuperare la capacità.	In base alla disponibilità delle risorse, puoi creare istanze di computing entro un tempo di attesa specificato. Per una VM con inizio flessibile autonoma, puoi specificare un tempo di attesa massimo di due ore. Per un MIG, Compute Engine continua a tentare di creare istanze di calcolo finché le risorse non diventano disponibili o non annulli la richiesta di creazione. Puoi controllare quando arrestare o eliminare le istanze di calcolo. Tuttavia, non puoi sospenderli o ricrearli. Le istanze di Compute vengono eseguite per un minimo di 10 minuti e un massimo di sette giorni. Quando le istanze di computing raggiungono la fine della durata di esecuzione, Compute Engine le arresta o le elimina in base all'azione di terminazione.	Puoi richiedere di prenotare la capacità in una data futura per creare istanze di computing. Se Google Cloud approva la tua richiesta, Compute Engine crea una prenotazione. All'inizio del periodo di prenotazione, puoi utilizzare la prenotazione creando istanze di computing corrispondenti. Durante il periodo di prenotazione approvato, puoi arrestare, riavviare, eliminare e ricreare istanze di computing per utilizzare la prenotazione in base alle tue esigenze. Al termine del periodo di prenotazione, Compute Engine elimina la prenotazione e arresta o elimina le istanze di computing che la utilizzano in base all'azione di terminazione.
Casi d'uso	Ideale per i workload che richiedono stabilità e funzionamento continuo, ad esempio: Server web Database Applicazioni aziendali Sviluppo e test	Ideale per i workload che possono tollerare interruzioni, ad esempio: Elaborazione dei dati in modalità batch Computing ad alte prestazioni (HPC) Integrazione e il deployment continui (CI/CD) Analisi di dati Codifica dei contenuti multimediali Inferenza online	Workload che richiedono stabilità e devono essere eseguiti per non più di sette giorni, ad esempio i seguenti workload: Pre-addestramento di modelli di piccole dimensioni Ottimizzazione del modello Simulazione HPC Inferenza batch	Ideale per i workload che richiedono stabilità e un tempo di esecuzione specifico, ad esempio: Per i workload che durano fino a 90 giorni: Job di pre-addestramento dei modelli Job di ottimizzazione dei modelli Workload di simulazione HPC Aumenti dei workload di inferenza previsti nel breve termine Per i workload più lunghi di 90 giorni: Workload di addestramento Workload di inferenza
Allocazione delle risorse	Best effort. Compute Engine posiziona fisicamente le risorse vicine tra loro nel miglior modo possibile. Per controllare il posizionamento, puoi utilizzare facoltativamente le policy di posizionamento.	Best effort. Compute Engine posiziona fisicamente le risorse vicine tra loro nel miglior modo possibile. Per controllare il posizionamento, puoi utilizzare facoltativamente le policy di posizionamento.	Densa al meglio delle possibilità. Compute Engine fa del suo meglio per posizionare le risorse vicine tra loro. Per controllare il posizionamento delle VM con avvio flessibile, puoi utilizzare facoltativamente una delle seguenti opzioni: Per le VM Flex-start autonome: policy di posizionamento compatte Per le VM con avvio flessibile in un MIG: policy del workload	Dense. Compute Engine posiziona fisicamente le risorse su host ad alto accoppiamento connessi da un'infrastruttura di rete ad alta velocità per ridurre al minimo la latenza di rete.
Prezzi	Ti vengono addebitati i prezzi standard per le istanze di calcolo. Consulta Prezzi delle istanze VM. I costi vengono addebitati in base al metodo utilizzato per creare le istanze di computing: Se crei immediatamente istanze di computing, paghi a consumo (PAYG). Se crei istanze di computing utilizzando una prenotazione on demand o una prenotazione creata automaticamente per una prenotazione futura, ti vengono addebitati costi per tutto il periodo di validità della prenotazione. Per ulteriori informazioni, vedi Fatturazione delle prenotazioni.	Ottieni sconti fino al 60% per le serie di macchine C3, M3 e A3. Per ulteriori informazioni, consulta la pagina dei prezzi. Utilizzi il pagamento a consumo.	In base alla serie di macchine utilizzata dalle tue istanze di computing, ottieni uno sconto come segue: Per le serie di macchine A4, A3 e A2, ottieni uno sconto del 53% per vCPU, memoria e GPU. Per la serie di macchine H4D, ottieni uno sconto del 25% per vCPU e memoria. Le altre serie di macchine supportate non sono idonee per gli sconti. Per ulteriori informazioni, consulta i prezzi di Dynamic Workload Scheduler (DWS). Utilizzi il pagamento a consumo.	I costi vengono addebitati in base a come prenoti la capacità per la creazione di istanze di computing nel seguente modo: Se prenoti capacità in AI Hypercomputer, ti verranno addebitati costi in base ai prezzi delle VM ottimizzate per gli acceleratori. Se prenoti risorse per un anno o più, devi acquistare e collegare un impegno basato sulle risorse alle risorse prenotate. Se prenoti capacità utilizzando le prenotazioni future in modalità calendario, ti vengono addebitati costi in base ai prezzi di Dynamic Workload Scheduler (DWS). Ti viene addebitato l'importo per il periodo di prenotazione. Per ulteriori informazioni, vedi Fatturazione delle prenotazioni.
Quota	Quando crei un'istanza di computing, viene utilizzata la quota standard.	Quando crei una VM spot, viene utilizzata la quota standard.	Quando crei una Flex-start VM, viene utilizzata la quota preemptible . Se il progetto non dispone di quota preassegnata, viene utilizzata la quota standard.	Il consumo di quota varia in base al metodo utilizzato per riservare le risorse: Prenotazioni future con cluster AI Hypercomputer o HPC: Google gestisce la quota per le risorse prenotate. Non è necessario richiedere manualmente la quota. All'ora di inizio della prenotazione futura approvata, Google aumenta automaticamente la quota se il tuo progetto non ne ha. Prenotazioni future in modalità calendario: per prenotare i tipi di macchine H4D, viene consumata la quota CPU. Per prenotare tipi di macchine GPU o TPU, non è richiesta alcuna quota.

Disponibilità e durata delle istanze di computing

La tabella seguente mostra la disponibilità e la durata delle istanze di computing per ogni modello di provisioning:

	Standard	Spot	Avvio flessibile	Con prenotazione
Prerequisiti per la creazione	Nessun prerequisito per la creazione.	Nessun prerequisito per la creazione.	Nessun prerequisito per la creazione.	Per creare istanze di computing, devi prima prenotare la capacità utilizzando uno dei seguenti metodi: Per prenotare la capacità per i carichi di lavoro a esecuzione prolungata, utilizza le prenotazioni future con AI Hypercomputer o le prenotazioni future con i cluster HPC. Per prenotare la capacità per i carichi di lavoro eseguiti per un massimo di 90 giorni, utilizza le prenotazioni future in modalità calendario. Alla data e all'ora di consegna scelte, Compute Engine esegue il provisioning della capacità richiesta. Quindi, puoi utilizzare la capacità creando istanze di computing.
Serie di macchine supportate	Puoi utilizzare qualsiasi serie di macchine, ad eccezione di A4X Max, A4X, A4 e A3 Ultra.	Puoi utilizzare tutte le serie di macchine (C3, M3 e A3). Lo spot per TPU7x è limitato da una lista consentita. Consulta questa nota.	Puoi utilizzare solo le seguenti serie di macchine: Serie di macchine A4, A3, A2, G4 e G2 TPU7x¹, TPU v6e e TPU v5p Istanze di macchine virtuali (VM) N1 con GPU collegate Serie di macchine H4D	A seconda di come prenoti la capacità per creare VM, puoi utilizzare solo le seguenti serie di macchine: Se prenoti la capacità in AI Hypercomputer, puoi utilizzare solo A4X Max, A4X, A4, A3 Ultra, A3 Mega con 8 GPU, A3 High con 8 GPU e A3 Edge. Se crei una prenotazione futura in modalità calendario, puoi utilizzare solo le seguenti serie: GPU: A4, A3 Ultra, A3 Mega con 8 GPU, A3 High con 8 GPU e serie di macchine H4D. TPU: TPU7x^*, v6e, v5p
Disponibilità delle istanze di computing	Puoi creare istanze di calcolo in qualsiasi momento, a condizione che le risorse richieste siano disponibili. Per ridurre le probabilità di riscontrare errori di disponibilità delle risorse, puoi visualizzare la disponibilità delle VM spot prima di crearle.	Puoi creare istanze di calcolo in qualsiasi momento, a condizione che le risorse richieste siano disponibili.	Puoi creare istanze di computing nel seguente modo: Crea un'istanza di computing autonoma. Crea un MIG che crea singolarmente istanze di Compute in base alla disponibilità. Crea un gruppo di istanze gestite che crea istanze di calcolo contemporaneamente. Compute Engine utilizza DWS per pianificare il provisioning della capacità richiesta in base alla disponibilità delle risorse. DWS ti aiuta a ottenere risorse ad alta richiesta come le GPU.	Puoi creare istanze di computing solo dopo aver prenotato la capacità per una data futura. Alla data della richiesta, Compute Engine fornisce la capacità desiderata, che puoi utilizzare per creare istanze di computing. Se prenoti risorse utilizzando le prenotazioni future in modalità calendario, Compute Engine utilizza DWS per eseguire il provisioning della capacità richiesta. DWS ti aiuta a ottenere risorse ad alta richiesta come le GPU.
Garanzia di capacità	In base al metodo di creazione. La garanzia di capacità varia in base al metodo utilizzato per creare le istanze di computing come segue: Se crei immediatamente istanze di calcolo, Compute Engine tenta di eseguire il provisioning della capacità richiesta nel miglior modo possibile. Se crei istanze di computing utilizzando una prenotazione on demand o una prenotazione creata automaticamente per una prenotazione futura, hai la certezza che Compute Engine esegua il provisioning della capacità richiesta se la prenotazione ha riservato la capacità disponibile.	Best effort. Quando crei VM spot, Compute Engine tenta di eseguire il provisioning della capacità richiesta nel miglior modo possibile.	Best effort. Quando crei una richiesta di ridimensionamento del MIG, Compute Engine tenta al meglio di pianificare il provisioning della capacità richiesta.	Molto alto. Se Google Cloud approva la tua richiesta di prenotazione, hai la certezza che Compute Engine esegue il provisioning della capacità prenotata alla data e all'ora di consegna che hai scelto. Hai accesso esclusivo alla capacità riservata per il periodo di prenotazione.
Durata dell'istanza di computing	Puoi controllare quando arrestare o eliminare un'istanza di computing. Tuttavia, se il tipo di macchina utilizzato dall'istanza di computing non supporta la migrazione live, Compute Engine arresta l'istanza di computing durante gli eventi di manutenzione dell'host.	Puoi controllare quando arrestare o eliminare un'istanza di computing, tranne nei seguenti casi: Compute Engine arresta o elimina l'istanza di computing per recuperare capacità. Questo processo è chiamato prerilascio. Se il tipo di macchina utilizzato dall'istanza di computing non supporta la migrazione live, Compute Engine arresta l'istanza di computing durante gli eventi di manutenzione dell'host.	Prima che un'istanza di computing raggiunga la fine della durata di esecuzione, puoi eseguire le seguenti operazioni: Arresta l'istanza di computing: se hai creato la Flex-start VM come istanza di computing autonoma o singolarmente in un MIG man mano che la capacità diventa disponibile, puoi arrestare le istanze di computing in qualsiasi momento. Non puoi arrestare le VM con avvio flessibile create in una richiesta di ridimensionamento del MIG. Elimina l'istanza di computing: puoi eliminare l'istanza di computing in qualsiasi momento. Quando un'istanza di computing raggiunge la fine della durata di esecuzione, Compute Engine la arresta o la elimina in base all'azione di terminazione.	Puoi controllare quando arrestare o eliminare un'istanza di computing, tranne nei seguenti casi: Compute Engine arresta l'istanza di computing durante gli eventi di manutenzione dell'host. La prenotazione creata automaticamente per eseguire il provisioning della capacità richiesta raggiunge la fine del periodo di impegno di prenotazione. A quel punto, Compute Engine elimina la prenotazione e arresta o elimina le eventuali istanze di computing che la utilizzano in base all' azione di terminazione specificata nella loro configurazione.

¹ Le prenotazioni spot, con avvio flessibile e future in modalità calendario per TPU7x sono limitate da una lista consentita. Per richiedere l'accesso, contatta il tuo team dedicato all'account o il team di vendita.

Passaggi successivi

Consulta una panoramica della creazione di istanze Compute Engine.
Scopri di più sulle VM spot.
Scopri di più sulle VM con avvio flessibile.
Scopri di più sulle istanze di calcolo che utilizzano il modello di provisioning vincolato alla prenotazione.

Modelli di provisioning delle istanze Compute Engine Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Modelli di provisioning disponibili

Disponibilità e durata delle istanze di computing

Passaggi successivi

Modelli di provisioning delle istanze Compute Engine