Informazioni sulle istanze che utilizzano il modello con prenotazione

Questo documento descrive le istanze Compute Engine che utilizzano il modello di provisioning vincolato alla prenotazione, inclusi i vantaggi e i requisiti di creazione.

Quando crei un'istanza di computing, devi specificare il modello di provisioning sottostante, che definisce la disponibilità, il prezzo e la durata delle risorse utilizzate dall'istanza di computing. Il modello di provisioning con prenotazione ti consente di creare istanze A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High con 8 GPU, A3 Edge e H4D utilizzando la capacità riservata di una prenotazione futura in modalità calendario o di una prenotazione futura in AI Hypercomputer.

Il modello di provisioning con prenotazione offre i seguenti vantaggi:

  • Controllo dei costi: non vengono addebitati costi aggiuntivi quando crei istanze di computing utilizzando la capacità riservata. Ti vengono addebitati costi solo per le risorse che non fanno parte della prenotazione, come dischi o indirizzi IP.

  • Gestione del ciclo di vita: in base all'azione di terminazione specificata quando crei le istanze di computing, Compute Engine arresta o elimina le istanze di computing al termine del periodo di prenotazione.

Informazioni sulle istanze che utilizzano il modello di provisioning con prenotazione

Le sezioni seguenti descrivono i requisiti che applichi quando crei istanze di computing utilizzando il modello di provisioning vincolato alla prenotazione.

Prerequisiti per la creazione di istanze di calcolo

Per utilizzare il modello di provisioning con prenotazione per creare istanze di computing, devi prima prenotare le risorse. Puoi prenotare le risorse nel seguente modo:

Se Google Cloud approva la tua richiesta di prenotazione futura, Compute Engine crea automaticamente (crea automaticamente) una prenotazione all'inizio del periodo di prenotazione. Puoi quindi utilizzare la prenotazione per creare istanze di computing.

Requisiti per la creazione di istanze di computing

Per creare un'istanza di computing utilizzando il modello di provisioning con prenotazione, devi specificare le seguenti configurazioni:

  • L'istanza di calcolo e la prenotazione devono avere proprietà corrispondenti. Puoi utilizzare la capacità prenotata per creare istanze solo se le proprietà dell'istanza e della prenotazione creata automaticamente corrispondono esattamente. Per saperne di più, consulta i requisiti per l'utilizzo delle prenotazioni.

  • L'istanza di computing deve avere come target specifico la prenotazione per il consumo. Quando crei un'istanza di calcolo, devi specificare il nome della prenotazione creata automaticamente da utilizzare, nonché impostare il campo reservationAffinity su SPECIFIC_RESERVATION. Per saperne di più, vedi Consuma una prenotazione con target specifico.

  • L'istanza di computing deve utilizzare il modello di provisioning con prenotazione. Quando crei un'istanza di computing, devi specificare il modello di provisioning vincolato alla prenotazione nel seguente modo:

    • Se utilizzi la console Google Cloud , seleziona Vincolato alla prenotazione nell'elenco Modello di provisioning.

    • Se utilizzi Google Cloud CLI, includi il flag --provisioning-model=RESERVATION_BOUND nel comando.

    • Se utilizzi l'API Compute Engine, includi il campo "provisioningModel": "RESERVATION_BOUND" nel corpo della richiesta.

  • L'istanza di computing deve essere arrestata o eliminata all'ora di fine della prenotazione. Quando crei un'istanza di computing, devi specificare se arrestare o eliminare l'istanza di computing all'ora di fine della prenotazione utilizzando il campo instanceTerminationAction. Per saperne di più, scopri come limitare il tempo di esecuzione di un'istanza di calcolo.

Dopo aver creato un'istanza di computing utilizzando il modello di provisioning vincolato alla prenotazione, l'istanza di computing inizia a essere eseguita e continua a essere eseguita finché non la arresti o la elimini oppure finché Compute Engine non la arresta o la elimina all'ora di fine della prenotazione.

Quota

Quando crei un'istanza di computing utilizzando il modello di provisioning con prenotazione, non hai bisogno di una quota per le risorse prenotate che utilizzi per creare l'istanza di computing. Hai bisogno di una quota solo per le risorse che non fanno parte della capacità riservata, come dischi e indirizzi IP. Per ulteriori informazioni sui diversi tipi di quota, consulta Quote di allocazione.

Prezzi

Quando crei un'istanza di computing utilizzando il modello di provisioning con prenotazione, ti vengono addebitati i costi nel seguente modo:

  • Gli addebiti iniziano quando crei l'istanza di computing. Non vengono addebitati costi aggiuntivi per le risorse prenotate che utilizzi per creare l'istanza di calcolo. Ti vengono addebitati costi solo per le risorse che non fanno parte della prenotazione, come dischi o indirizzi IP. Per ulteriori informazioni, consulta la fatturazione per le prenotazioni.

  • Gli addebiti terminano all'ora di fine della prenotazione. A quel punto, Compute Engine elimina la prenotazione e arresta o elimina l'istanza di computing in base all'azione di terminazione specificata nell'istanza di computing.

Limitazioni

Per creare istanze di calcolo utilizzando il modello di provisioning con prenotazione, devi utilizzare una delle seguenti serie di macchine:

  • A4X Max

  • A4X

  • A4

  • A3 Ultra

  • A3 Mega

  • A3 High con 8 GPU

  • H4D

Per informazioni sull'utilizzo di altre serie di macchine ottimizzate per l'acceleratore con il modello di provisioning vincolato alla prenotazione, contatta il tuo team dell'account o il team di vendita.

Passaggi successivi

Provalo

Se non conosci Google Cloud, crea un account per valutare le prestazioni di Compute Engine in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.

Prova Compute Engine senza costi