Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Scegli un'opzione di consumo

Questo documento spiega i diversi modi, chiamati opzioni di consumo, per ottenere e utilizzare le risorse di calcolo su AI Hypercomputer. Scegli l'opzione più adatta al tuo carico di lavoro, alla sua durata e alle tue esigenze di costo.

Ogni opzione di consumo specifica quanto segue:

Come accedere alla capacità per creare VM o cluster.
Il modello di provisioning sottostante, che determina la disponibilità, la durata e i prezzi delle VM.

Confronto delle opzioni di consumo

La seguente tabella riassume le principali differenze tra le opzioni di consumo:

Opzione di consumo	Prenotazioni future in AI Hypercomputer	Prenotazioni future fino a 90 giorni (in modalità calendario)	Avvio flessibile	Spot
Macchine supportate	A4X Max, A4X, A4, A3 Ultra, A3 Mega o A3 High	A4, A3 Ultra, A3 Mega o A3 High con 8 GPU	Qualsiasi macchina GPU tranne A4X Max e A4X	Qualsiasi macchina GPU tranne A4X Max e A4X
Durata	Illimitato	Fino a 90 giorni	Fino a 7 giorni	Illimitato (ma soggetto a preemption)
Prerilasciabile
Garanzia di capacità	Molto alto. Se Google Cloud approva la richiesta di prenotazione, hai una garanzia molto elevata che Compute Engine esegua il provisioning della capacità richiesta.	Molto alto. Se Google Cloud approva la richiesta di prenotazione, hai una garanzia molto elevata che Compute Engine esegua il provisioning della capacità richiesta.	Best effort. Compute Engine tenta al meglio di pianificare il provisioning della capacità richiesta.	Best effort. Compute Engine tenta di eseguire il provisioning della capacità richiesta nel miglior modo possibile.
Quota	Google Cloud aumenta automaticamente la quota prima che venga fornita la capacità.	Non viene consumata alcuna quota.	Consuma la quota preemptible.	Consuma la quota preemptible.
Prezzi	Scontati (fino al 53%). Consulta i prezzi delle VM ottimizzate per gli acceleratori. Se prenoti risorse per un anno o più, devi acquistare e collegare un impegno basato sulle risorse alle risorse prenotate. Ti viene addebitato l'importo per il periodo di prenotazione. Vedi fatturazione delle prenotazioni.	Scontati (fino al 53%). Consulta i prezzi di Dynamic Workload Scheduler. Ti viene addebitato l'importo per il periodo di prenotazione. Vedi fatturazione delle prenotazioni.	Scontati (fino al 53%). Consulta i prezzi di Dynamic Workload Scheduler. Paghi in base al consumo (PAYG).	Scontati in modo significativo (fino al 91%). Consulta i prezzi delle VM spot e i prezzi delle VM ottimizzate per gli acceleratori. Paghi in base al consumo (PAYG).
Allocazione delle risorse	Dense	Dense	Denso in base al massimo impegno ( policy compatte o policy del workload facoltative)	Standard (policy compatta facoltativa)
Modello di provisioning	Con prenotazione	Con prenotazione	Avvio flessibile	Spot
Metodo di creazione	Per creare VM, devi: Prenota la capacità contattando il team dedicato all'account. Nella data e nell'ora che hai scelto, puoi utilizzare la capacità riservata per creare VM e cluster utilizzando uno dei metodi descritti nella Panoramica delle opzioni di deployment.	Per creare VM, devi: Crea una prenotazione futura in modalità calendario. Nella data e nell'ora che hai scelto, puoi utilizzare la capacità riservata per creare VM e cluster utilizzando uno dei metodi descritti nella Panoramica delle opzioni di deployment.	Quando richiedi la creazione di VM con avvio flessibile, Compute Engine pianifica la creazione delle VM in base alla disponibilità. Quando la capacità diventa disponibile, Compute Engine esegue il provisioning delle VM con avvio flessibile. Per creare VM con avvio flessibile, utilizza uno dei metodi descritti nella Panoramica delle opzioni di deployment.	Puoi creare immediatamente VM utilizzando uno dei metodi descritti nella panoramica delle opzioni di deployment.

Scegli un'opzione di consumo

Utilizza il seguente diagramma di flusso per scegliere l'opzione di consumo più adatta al tuo workload:

Un diagramma di flusso con le opzioni di consumo per AI Hypercomputer.

Le domande nel diagramma precedente sono le seguenti:

Hai bisogno di capacità per più di 90 giorni?
- Sì: consulta Utilizzare le prenotazioni future in AI Hypercomputer.
- No: vai alla domanda 2.
Vuoi la capacità riservata?
- Sì: vedi Utilizzare le prenotazioni future in modalità calendario.
- No: vai alla domanda 3.
Il carico di lavoro è a tolleranza di errore?
- No: vedi Usare avvio flessibile.
- Sì: vedi Usare Spot.

Utilizzare le prenotazioni future in AI Hypercomputer

Per eseguire carichi di lavoro distribuiti di lunga durata e su larga scala che richiedono risorse allocate in modo denso, puoi richiedere risorse di calcolo per un momento specifico nel futuro. Hai accesso esclusivo alle risorse prenotate per quel periodo di tempo e puoi utilizzarle per creare VM o cluster. Al termine del periodo di prenotazione, Compute Engine esegue le seguenti operazioni:

Compute Engine elimina la prenotazione.
In base all'azione di terminazione specificata per le VM, Compute Engine arresta o elimina le VM che utilizzano la prenotazione.

Workload ideali per prenotazioni future in AI Hypercomputer

Le prenotazioni future sono ideali per i seguenti workload:

Modelli di base preaddestrati
Inferenza del modello di base multi-host

Caratteristiche principali delle prenotazioni future in AI Hypercomputer

Le prenotazioni future hanno le seguenti caratteristiche:

Puoi prenotare i tipi di macchine A4X Max, A4X, A4, A3 Ultra, A3 Mega o A3 High (8 GPU). Le macchine vengono allocate in modo denso per ridurre al minimo la latenza di rete.
Puoi prenotare un numero qualsiasi di VM per qualsiasi durata a partire da una data futura. Utilizza le risorse prenotate per creare ed eseguire VM fino al termine del periodo di prenotazione. Se prenoti risorse per un anno o più, devi acquistare e allegare un impegno basato sulle risorse.
Dopo l'inizio del periodo di prenotazione, puoi modificare le prenotazioni create automaticamente nel seguente modo:
- Attivare o disattivare le notifiche di manutenzione di emergenza dell'hardware
- Abilita o disabilita l'utilizzo dei job Vertex AI
Utilizzi il modello di provisioning con prenotazione, che offre i seguenti vantaggi:
- Hai una maggiore probabilità di ottenere GPU.
- Oltre all'impegno associato alle tue VM, ottieni uno sconto fino al 53% per vCPU e GPU.

Come utilizzare le prenotazioni future in AI Hypercomputer

Per utilizzare le prenotazioni future per creare VM o cluster, devi completare i seguenti passaggi:

Richiedi di prenotare la capacità. Contatti il team dedicato all'account e specifichi le risorse da prenotare. In base alla disponibilità, Google crea una bozza di richiesta di prenotazione per te. Se ti sembra corretta, puoi inviarla. Google Cloud approva immediatamente la richiesta di prenotazione.

Per istruzioni, vedi Capacità di riserva.
Consuma le risorse prenotate. All'inizio del periodo di prenotazione scelto, puoi utilizzare la prenotazione per creare VM o cluster.

Per i diversi metodi di creazione di VM o cluster, vedi Panoramica delle opzioni di deployment.

Utilizzare le prenotazioni future in modalità calendario

Per eseguire workload distribuiti di breve durata che richiedono risorse allocate in modo denso, puoi richiedere risorse di calcolo per un massimo di 90 giorni. Hai accesso esclusivo alle risorse prenotate per quel periodo di tempo e puoi utilizzare le risorse per creare VM o cluster. Al termine del periodo di prenotazione, Compute Engine esegue le seguenti operazioni:

Compute Engine elimina la prenotazione.
In base all'azione di terminazione specificata per le VM, Compute Engine arresta o elimina le VM che utilizzano la prenotazione.

Carichi di lavoro ideali per le prenotazioni future in modalità calendario

Le prenotazioni future in modalità calendario sono ideali per i seguenti workload:

Pre-addestramento del modello
Ottimizzazione del modello
Simulazioni
Inferenza

Caratteristiche principali delle prenotazioni future in modalità calendario

Le prenotazioni future in modalità calendario hanno le seguenti caratteristiche:

Puoi prenotare i tipi di macchine A4, A3 Ultra, A3 Mega o A3 High (8 GPU). Queste macchine sono allocate in modo denso per ridurre al minimo la latenza di rete.
Puoi visualizzare la disponibilità futura e prenotare fino a 80 VM per un massimo di 90 giorni. Dopodiché, puoi utilizzare le risorse prenotate per creare VM fino al termine del periodo di prenotazione.
Dopo l'inizio del periodo di prenotazione, puoi modificare le prenotazioni create automaticamente nel seguente modo:
- Attivare o disattivare le notifiche di manutenzione di emergenza dell'hardware
- Abilita o disabilita l'utilizzo dei job Vertex AI
Utilizzi il modello di provisioning con prenotazione, che offre i seguenti vantaggi:
- Hai una maggiore probabilità di ottenere GPU.
- Ottieni uno sconto fino al 53% per vCPU e GPU.

Come utilizzare le prenotazioni future in modalità calendario

Per utilizzare le prenotazioni future in modalità calendario per creare VM o cluster, devi completare i seguenti passaggi:

Visualizza la disponibilità delle risorse. Puoi visualizzare la disponibilità futura delle risorse che vuoi prenotare. Quando crei una richiesta di prenotazione, puoi specificare il numero, il tipo e la durata della prenotazione per le risorse che hai confermato come disponibili. Questa azione aumenta le probabilità che Google Cloud approvi la tua richiesta.

Per istruzioni, vedi Visualizzare la disponibilità futura delle risorse.
Riserva capacità. Crea una richiesta di prenotazione per una data e un'ora future. Google Cloud approva la richiesta di prenotazione entro due minuti. Se approvata, Compute Engine riserva la capacità. Nella data di consegna scelta, puoi utilizzare le risorse prenotate per creare VM o cluster.

Per istruzioni, vedi Crea una richiesta di prenotazione per VM GPU o TPU.
Consuma le risorse prenotate. All'inizio del periodo di prenotazione scelto, puoi utilizzare la prenotazione per creare VM o cluster.

Per i diversi metodi di creazione di VM o cluster, consulta quanto segue:
- Per creare VM A4, A3 Ultra, A3 Mega o A3 High (8 GPU), consulta Panoramica delle opzioni di deployment.
- Per creare VM A3 Mega o A3 High (8 GPU) con GPUDirect-TCPX abilitato, consulta Crea una VM A3 con GPUDirect-TCPX abilitato.

Usa avvio flessibile

Per eseguire workload di breve durata che richiedono risorse allocate in modo denso, puoi richiedere risorse di calcolo fino a sette giorni utilizzando l'avvio flessibile. Ogni volta che le risorse sono disponibili, Compute Engine crea il numero di VM richiesto. Puoi arrestare le VM con avvio flessibile autonome, ma non puoi arrestare le VM con avvio flessibile che un gruppo di istanze gestite (MIG) crea tramite richieste di ridimensionamento. Le VM Flex-start esistono finché non le elimini o finché Compute Engine non le elimina al termine della loro durata di esecuzione.

Workload ideali per l'avvio flessibile

L'inizio flessibile è ideale per i workload che possono iniziare in qualsiasi momento, ad esempio:

Pre-addestramento di modelli di piccole dimensioni
Ottimizzazione del modello
Simulazioni
Inferenza batch

Caratteristiche principali dell'avvio flessibile

L'avvio flessibile presenta le seguenti caratteristiche:

Puoi richiedere qualsiasi tipo di macchina GPU, ad eccezione di A4X Max e A4X. Compute Engine tenta di allocare le macchine in modo denso, il che potrebbe comportare una grande distanza tra le VM Flex-start all'interno della stessa zona. Per controllare il posizionamento delle VM e ridurre al minimo la latenza di rete, puoi:
- Per le VM Flex-start autonome, applica una policy di posizionamento compatto alle VM.
- Per i MIG con una dimensione target, applica una policy del workload.
Utilizzi il modello di provisioning con avvio flessibile, che offre i seguenti vantaggi:
- Hai una maggiore probabilità di ottenere GPU.
- Ottieni uno sconto fino al 53% per vCPU, memoria e GPU.

Come utilizzare l'avvio flessibile

Per utilizzare l'avvio flessibile per creare VM o cluster, devi completare i seguenti passaggi:

(Facoltativo) Crea una policy di posizionamento compatto o una policy del workload. Puoi creare una policy di posizionamento compatto (per VM autonome o in blocco) o una policy del workload (per i MIG) per specificare la vicinanza delle VM. La configurazione scelta influisce sui tipi di macchine e sul numero di VM supportate dal criterio.
Crea VM con avvio flessibile. Dopo aver richiesto la creazione di VM, Compute Engine pianifica la creazione delle VM in base alla disponibilità. Quando la capacità diventa disponibile, Compute Engine esegue il provisioning delle VM con avvio flessibile. Le VM vengono eseguite fino a quando non le arresti o le elimini oppure fino al termine della durata di esecuzione.

Per istruzioni, vedi Panoramica delle opzioni di deployment.

Utilizzare Spot

Per eseguire carichi di lavoro a tolleranza di errore, puoi ottenere immediatamente risorse di calcolo in base alla disponibilità. Ottieni risorse al prezzo più basso possibile. Tuttavia, Compute Engine può prerilasciare le VM in qualsiasi momento per recuperare capacità.

Workload ideali per Spot

Spot è ideale per i carichi di lavoro in cui le interruzioni sono accettabili, ad esempio:

Elaborazione dei dati in modalità batch
Computing ad alte prestazioni (HPC)
Integrazione e il deployment continui (CI/CD)
Analisi di dati
Codifica dei contenuti multimediali
Inferenza online

Caratteristiche principali di Spot

Spot ha le seguenti caratteristiche:

Puoi creare qualsiasi tipo di macchina GPU, ad eccezione di A4X Max e A4X. L'allocazione densa dipende dalla disponibilità delle risorse. Per garantire un'allocazione più vicina, puoi applicare una policy di posizionamento compatto alle VM.
Puoi creare immediatamente le VM. Le VM vengono eseguite fino a quando non le arresti o le elimini oppure fino a quando Compute Engine non le prerilascia per recuperare capacità.
Utilizzi il modello di provisioning delle VM spot, che offre i seguenti vantaggi:
- Hai una maggiore probabilità di ottenere GPU.
- Ottieni uno sconto fino al 91% per molti tipi di macchine, GPU, TPU e dischi SSD locali.

Come utilizzare Spot

Per utilizzare Spot per creare VM o cluster, devi completare i seguenti passaggi:

Visualizza la disponibilità delle risorse. Puoi visualizzare la disponibilità delle risorse nella regione o nella zona in cui vuoi creare VM spot. Questa azione contribuisce a ridurre le probabilità di riscontrare errori di disponibilità delle risorse.

Per istruzioni, vedi Visualizzare la disponibilità delle VM spot.
(Facoltativo) Visualizza il tasso di preemptive e i prezzi. Puoi visualizzare il tasso di preemptivezza e i prezzi storici e attuali per diversi tipi di macchine e zone. Queste informazioni ti aiutano a scegliere il tipo di macchina e la località più adatti al tuo carico di lavoro e al tuo budget.

Per istruzioni, consulta Visualizzare il tasso di preemptive e i prezzi delle VM spot.
(Facoltativo) Crea una policy di posizionamento compatto o una policy del workload. Puoi creare una policy di posizionamento compatto (per VM autonome o in blocco) o una policy del workload (per i MIG) per specificare la vicinanza delle VM. La configurazione scelta influisce sui tipi di macchine e sul numero di VM supportate dal criterio.

Per istruzioni, consulta Riduci la latenza utilizzando le policy di posizionamento compatto o Crea policy del workload per i MIG.
Crea VM spot. Puoi creare tutte le VM che vuoi, in base alla disponibilità. Le VM vengono eseguite fino a quando non le arresti o le elimini oppure fino a quando Compute Engine non le prerilascia per recuperare capacità.

Per istruzioni, vedi Panoramica delle opzioni di deployment.

Scegli un'opzione di consumo Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Confronto delle opzioni di consumo

Scegli un'opzione di consumo

Utilizzare le prenotazioni future in AI Hypercomputer

Workload ideali per prenotazioni future in AI Hypercomputer

Caratteristiche principali delle prenotazioni future in AI Hypercomputer

Come utilizzare le prenotazioni future in AI Hypercomputer

Utilizzare le prenotazioni future in modalità calendario

Carichi di lavoro ideali per le prenotazioni future in modalità calendario

Caratteristiche principali delle prenotazioni future in modalità calendario

Come utilizzare le prenotazioni future in modalità calendario

Usa avvio flessibile

Workload ideali per l'avvio flessibile

Caratteristiche principali dell'avvio flessibile

Come utilizzare l'avvio flessibile

Utilizzare Spot

Workload ideali per Spot

Caratteristiche principali di Spot

Come utilizzare Spot

Scegli un'opzione di consumo