Questo documento spiega come creare un'istanza Compute Engine autonoma utilizzando il modello di provisioning vincolato alla prenotazione. Questo modello di provisioning ti consente di creare istanze A4X Max, A4X, A4 o A3 Ultra utilizzando la capacità prenotata in anticipo.
Per altri metodi di creazione di istanze utilizzando il modello di provisioning con prenotazione, consulta Panoramica delle opzioni di deployment nella documentazione di AI Hypercomputer.
Prima di iniziare
-
Se non l'hai ancora fatto, configura l'autenticazione.
L'autenticazione verifica la tua identità per l'accesso ad API e servizi Google Cloud . Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:
gcloud initSe utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
- Set a default region and zone.
REST
Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.
Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:
gcloud initSe utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
Per saperne di più, consulta Autenticati per usare REST nella documentazione sull'autenticazione di Google Cloud .
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare istanze di computing utilizzando il modello di provisioning vincolato alla prenotazione, chiedi all'amministratore di concederti il ruolo IAM Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.Questo ruolo predefinito contiene le autorizzazioni necessarie per creare istanze di computing utilizzando il modello di provisioning vincolato alla prenotazione. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per creare istanze di computing utilizzando il modello di provisioning con prenotazione, sono necessarie le seguenti autorizzazioni:
-
compute.instances.createsul progetto -
Per utilizzare un'immagine personalizzata per creare la VM:
compute.images.useReadOnlysull'immagine -
Per utilizzare uno snapshot per creare la VM:
compute.snapshots.useReadOnlysullo snapshot -
Per utilizzare un template di istanza per creare la VM:
compute.instanceTemplates.useReadOnlysul template di istanza -
Per specificare una subnet per la VM:
compute.subnetworks.usesul progetto o sulla subnet scelta -
Per specificare un indirizzo IP statico per la VM:
compute.addresses.usesul progetto -
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete VPC:
compute.subnetworks.useExternalIpsul progetto o sulla subnet scelta -
Per assegnare una rete legacy alla VM:
compute.networks.usesul progetto -
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete legacy:
compute.networks.useExternalIpsul progetto -
Per impostare i metadati dell'istanza VM per la VM:
compute.instances.setMetadatasul progetto -
Per impostare i tag per la VM:
compute.instances.setTagssulla VM -
Per impostare le etichette per la VM:
compute.instances.setLabelssulla VM -
Per impostare un service account che la VM possa utilizzare:
compute.instances.setServiceAccountsulla VM -
Per creare un nuovo disco per la VM:
compute.disks.createsul progetto -
Per collegare un disco esistente in modalità di sola lettura o di lettura e scrittura:
compute.disks.usesul disco -
Per collegare un disco esistente in modalità di sola lettura:
compute.disks.useReadOnlysul disco
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Crea un'istanza che utilizza il modello di provisioning con prenotazione
Per creare un'istanza di calcolo A4X Max, A4X, A4 o A3 Ultra utilizzando il modello di provisioning con prenotazione, devi attendere che la prenotazione creata automaticamente che vuoi utilizzare raggiunga l'ora di inizio. Inoltre, l'istanza che intendi creare deve soddisfare tutti i seguenti requisiti:
L'istanza e la prenotazione devono avere proprietà corrispondenti.
L'istanza deve avere come target specifico la prenotazione per il consumo.
L'istanza deve essere arrestata o eliminata all'ora di fine della prenotazione.
Il seguente esempio crea una richiesta di prenotazione futura in modalità calendario per cinque istanze A3 Ultra, quindi crea un'istanza A3 Ultra utilizzando la prenotazione creata automaticamente per la richiesta.
Per creare un'istanza di esempio utilizzando il modello di provisioning con prenotazione, seleziona una delle seguenti opzioni:
Console
Crea una richiesta di esempio per cinque istanze A3 Ultra e inviala per la revisione:
Nella console Google Cloud , vai alla pagina Prenotazioni.
Fai clic sulla scheda Prenotazioni future.
Fai clic su Crea prenotazione futura. Viene visualizzata la pagina Crea una prenotazione futura.
Nella sezione Configurazione hardware, seleziona Specifica il tipo di macchina, quindi specifica un'istanza A3 Ultra.
Nella sezione Metodo di ottenimento, completa i seguenti passaggi:
Seleziona Cerca la capacità per un massimo di 90 giorni.
Negli elenchi Regione e Zona, specifica la regione e la zona in cui prenotare le risorse. Per questo esempio, seleziona rispettivamente us-central1 e us-central1-a.
Nel campo Capacità totale necessaria, inserisci
5.Nella sezione Periodo di prenotazione, specifica il periodo di prenotazione per la prenotazione.
Specifica i campi rimanenti, quindi fai clic su Invia.
All'ora di inizio della richiesta, per creare un'istanza A3 Ultra che utilizzi la prenotazione creata automaticamente di esempio, procedi nel seguente modo:
Nella console Google Cloud , vai alla pagina Crea un'istanza.
Nel campo Nome, inserisci un nome per l'istanza. Per questo esempio, inserisci
example-instance.Specifica la Regione e la Zona in cui vuoi prenotare le risorse. Per questo esempio, seleziona rispettivamente us-central1 e us-central1-a.
Fai clic sulla scheda GPU, quindi seleziona NVIDIA H200 141 GB nell'elenco Tipo di GPU. Questa azione specifica un'istanza A3 Ultra e imposta il modello di provisioning su Con prenotazione.
Nel menu di navigazione, fai clic su Avanzate.
Nella sezione Prenotazioni, seleziona Scegli una prenotazione, quindi fai clic su Scegli una prenotazione.
Nel riquadro Scegli una prenotazione:
Seleziona una prenotazione specifica. Se vuoi utilizzare una prenotazione condivisa esistente in un altro progetto, seleziona il progetto che include la prenotazione nell'elenco Progetto.
Fai clic su Scegli.
Nella sezione Modello di provisioning, espandi la sezione Impostazioni avanzate del modello di provisioning delle VM.
Nell'elenco Informazioni sulla terminazione delle VM, seleziona Arresta (impostazione predefinita) o Elimina.
Fai clic su Crea.
gcloud
Per creare una richiesta di esempio per cinque istanze A3 Ultra e inviarla per la revisione, utilizza il comando
gcloud beta compute future-reservations create:gcloud beta compute future-reservations create example-fr \ --auto-delete-auto-created-reservations \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=example-reservation \ --share-type=local \ --start-time=2025-10-05T00:00:00Z \ --end-time=2025-10-19T00:00:00Z \ --machine-type=a3-ultragpu-8g \ --total-count=5 \ --zone=us-central1-aSupponiamo che Google Cloud approvi la richiesta e Compute Engine crei automaticamente una prenotazione vuota. All'ora di inizio della richiesta, il 5 ottobre 2025, Compute Engine aumenta il numero di istanze GPU dedicate nella prenotazione. A questo punto puoi utilizzare la prenotazione.
All'ora di inizio della richiesta, per creare un'istanza A3 Ultra per utilizzare la prenotazione di esempio creata automaticamente, utilizza il comando
gcloud compute instances createcon i seguenti flag:Il flag
--instance-termination-action.Il flag
--provisioning-modelimpostato suRESERVATION_BOUND.Il flag
--reservation.Il flag
--reservation-affinityimpostato suspecific.
Il comando è simile al seguente. Per i requisiti completi per creare un'istanza A3 Ultra, consulta Crea un'istanza A3 Ultra o A4.
gcloud compute instance create example-instance \ --machine-type=a3-ultragpu-8g \ --instance-termination-action=TERMINATION_ACTION \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL \ --zone=us-central1-a \ ...Il comando include i seguenti valori:
TERMINATION_ACTION: indica se Compute Engine arresta (STOP) o elimina (DELETE) l'istanza al termine del periodo di prenotazione.RESERVATION_URL: l'URL della prenotazione, formattato come segue:Se la prenotazione creata automaticamente esiste nel tuo progetto:
example-reservation.Se la prenotazione creata automaticamente esiste in un progetto diverso:
projects/PROJECT_ID/reservations/example-reservation.
REST
Per creare una richiesta di esempio per cinque istanze A3 Ultra e inviarla per la revisione, invia una richiesta
POSTal metodofutureReservations.insertbeta:POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/futureReservations { "name": "example-request-calendar-mode", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "example-reservation", "shareSettings": { "shareType": "LOCAL" }, "specificReservationRequired": true, "specificSkuProperties": { "machineType": "a3-ultragpu-8g", "totalCount": 5 }, "timeWindow": { "startTime": "2025-10-05T00:00:00Z", "endTime": "2025-10-19T00:00:00Z" } }Supponiamo che Google Cloud approvi la richiesta e Compute Engine crei automaticamente una prenotazione vuota. All'ora di inizio della richiesta, il 5 ottobre 2025, Compute Engine aumenta il numero di istanze GPU dedicate nella prenotazione. A questo punto puoi utilizzare la prenotazione.
All'ora di inizio della richiesta, per creare un'istanza A3 Ultra che utilizzi la prenotazione di esempio creata automaticamente, invia una richiesta
POSTal metodoinstances.insert. Nel corpo della richiesta, includi i seguenti campi:Il campo
reservationAffinity.consumeReservationTypeimpostato suSPECIFIC_RESERVATION.Il campo
reservationAffinity.keyimpostato sucompute.googleapis.com/reservation-name.Il campo
reservationAffinity.valuesimpostato sull'URL della prenotazione.Il campo
scheduling.instanceTerminationAction.Il campo
scheduling.provisioningModelimpostato suRESERVATION_BOUND.
La richiesta è simile alla seguente. Per i requisiti completi per creare un'istanza A3 Ultra, consulta Crea un'istanza A3 Ultra o A4.
POST https://compute.googleapis.com/compute/beta/projects/example-project/zones/us-central1-a/instances { { "machineType": "projects/example-project/zones/us-central1-a/machineTypes/a3-ultragpu-8g", "name": "example-instance", "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values":[ "RESERVATION_URL" ], }, "scheduling": { "instanceTerminationAction": "TERMINATION_ACTION", "provisioningModel": "RESERVATION_BOUND" }, ... } }Il corpo della richiesta include i seguenti valori:
RESERVATION_URL: l'URL della prenotazione, formattato come segue:Se la prenotazione creata automaticamente esiste nel tuo progetto:
example-reservation.Se la prenotazione creata automaticamente esiste in un progetto diverso:
projects/PROJECT_ID/reservations/example-reservation.
TERMINATION_ACTION: indica se Compute Engine arresta (STOP) o elimina (DELETE) l'istanza al termine del periodo di prenotazione.
Passaggi successivi
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Compute Engine in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
Prova Compute Engine senza costiSalvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2026-01-14 UTC.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2026-01-14 UTC."],[],[]] -