Questo documento spiega come ottenere la capacità quando vuoi utilizzare le prenotazioni future nell'opzione di utilizzo di AI Hypercomputer. Per scoprire tutte le opzioni di capacità in AI Hypercomputer, consulta la panoramica della capacità.
Per avere la certezza che i tuoi carichi di lavoro dispongano delle risorse necessarie, richiedi una prenotazione futura a Google. Questa azione ti consente di prenotare blocchi di capacità per una durata definita, a partire da una data e un'ora specifiche che scegli. In base alla tua richiesta, Google crea una bozza di richiesta di prenotazione futura. Dopo aver esaminato e inviato questa bozza di richiesta e che Google Cloud l'ha approvata, Compute Engine crea automaticamente (crea automaticamente) una prenotazione vuota. Poi, all'ora di inizio scelta, Compute Engine esegue il provisioning della capacità richiesta nella prenotazione creata automaticamente. Puoi quindi utilizzare la prenotazione per creare istanze Compute Engine fino al termine del periodo di prenotazione.
Limitazioni
Questa sezione descrive le limitazioni per le richieste di prenotazione futura e per la prenotazione creata automaticamente per una richiesta.
Limitazioni per le richieste di prenotazione futura
Dopo che Google ha creato una bozza di richiesta di prenotazione futura per te, si applicano le seguenti limitazioni:
- Non puoi modificare i dettagli della richiesta, incluso il tipo di condivisione.
- Una volta inviata e approvata la richiesta e il suo stato cambia in
PROVISIONING, non puoi annullarla o eliminarla. Ti impegni a pagare la capacità richiesta a partire dall'ora di inizio della richiesta, indipendentemente dall'utilizzo.
Limitazioni per le prenotazioni create automaticamente
Dopo che Compute Engine crea una prenotazione on demand per soddisfare la capacità richiesta, si applicano le seguenti limitazioni:
- Puoi utilizzare o modificare la prenotazione solo dopo l'ora di inizio della richiesta.
-
Puoi modificare la prenotazione solo come segue:
- Abilita o disabilita l'utilizzo delle prenotazioni in Vertex AI
- Attiva le notifiche di manutenzione di emergenza dell'hardware
Per modificare altre proprietà in una prenotazione, devi contattare il tuo team dedicato all'account.
- Non puoi eliminare manualmente la prenotazione. Se, quando prenoti la capacità, specifichi che non vuoi eliminare automaticamente la prenotazione al termine del periodo di prenotazione, devi contattare il team dell'account per eliminare la prenotazione.
Prima di iniziare
Se non l'hai ancora fatto, controlla le configurazioni di VM e cluster disponibili.
-
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
REST
Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.
Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:
gcloud initSe utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
Per saperne di più, consulta Autenticati per usare REST nella documentazione sull'autenticazione di Google Cloud .
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare una richiesta di prenotazione futura, chiedi all'amministratore di concederti il ruolo IAM Compute Future Reservation User (
roles/compute.futureReservationUser) sul progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.Questo ruolo predefinito contiene le autorizzazioni necessarie per creare una richiesta di prenotazione futura. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per creare una richiesta di prenotazione futura, sono necessarie le seguenti autorizzazioni:
-
Per consentire a Compute Engine di creare in automatico le prenotazioni:
compute.reservations.createsul progetto -
Per creare una richiesta di prenotazione futura:
compute.futureReservations.createsul progetto -
Per specificare un modello di istanza:
compute.instanceTemplates.useReadOnlysul template di istanza
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Quota
Nell'ambito della procedura di richiesta di prenotazione futura, Google gestisce la quota delle risorse prenotate. Non è necessario richiedere una quota. All'ora di inizio della prenotazione futura approvata, Google aumenta automaticamente la quota se il progetto non dispone di risorse sufficienti per le risorse prenotate.
Panoramica
Per prenotare blocchi di capacità, completa i seguenti passaggi:
- Richiedi capacità tramite il tuo team dell'account. Contatta il team dedicato al tuo account per specificare il tipo e il numero di risorse che vuoi prenotare.
- Rivedi e invia una bozza di richiesta di prenotazione. Dopo che Google ha creato una bozza di richiesta di prenotazione futura, esaminala. Se ti sembra corretto, invia la richiesta di revisione. Google Cloud lo approva immediatamente.
Richiedere capacità tramite il team dell'account
Contatta il team dedicato al tuo account e fornisci le seguenti informazioni per consentire a Google di creare una bozza di richiesta di prenotazione futura:
- Numero di progetto: il numero del progetto in cui il team dedicato al tuo account crea la richiesta e Compute Engine esegue il provisioning della capacità.
- Tipo di macchina: il tipo di macchina da prenotare. Puoi specificare uno dei seguenti valori:
- A4X Max (
a4x-maxgpu-4g-metal) - A4X (
a4x-highgpu-4g) - A4 (
a4-highgpu-8g) - A3 Ultra (
a3-ultragpu-8g) - A3 Mega (
a3-megagpu-8g) - A3 High (
a3-highgpu-8g)
- A4X Max (
- Zona: la zona in cui vuoi prenotare la capacità. Per esaminare le regioni e le zone disponibili per un tipo di macchina GPU, consulta la sezione Disponibilità degli acceleratori.
- Conteggio totale: il numero totale di istanze di calcolo da prenotare. Puoi prenotare solo multipli di due istanze di computing. Le dimensioni dei blocchi e il numero di istanze di computing per blocco variano in base al tipo di macchina e alla disponibilità. Il team dedicato al tuo account può fornire ulteriori dettagli sulla tua richiesta.
- Ora di inizio: l'ora di inizio del periodo di prenotazione. Puoi iniziare a utilizzare la capacità
riservata in quel momento. Formatta l'ora di inizio come timestamp RFC 3339 nel seguente modo:
YYYY-MM-DDTHH:MM:SSOFFSET
Sostituisci quanto segue:
YYYY-MM-DD: una data formattata come anno a quattro cifre, mese a due cifre e giorno del mese a due cifre, separati da trattini (-).HH:MM:SS: un orario formattato con l'ora a due cifre utilizzando il sistema a 24 ore, i minuti a due cifre e i secondi a due cifre, separati da due punti (:).OFFSET: il fuso orario formattato come offset rispetto al Tempo Universale Coordinato (UTC). Ad esempio, per utilizzare il fuso orario PST (Pacific Standard Time), specifica-08:00. Per non utilizzare alcun offset, specificaZ.
- Ora di fine: l'ora di fine del periodo di prenotazione. Formatta come timestamp RFC 3339. A
questo punto, Compute Engine esegue le seguenti operazioni:
- Compute Engine elimina la prenotazione creata automaticamente.
- In base all' azione di terminazione specificata per le istanze di calcolo, Compute Engine arresta o elimina le istanze di calcolo create utilizzando la prenotazione creata automaticamente.
- Nome prenotazione: il nome della prenotazione creata da Compute Engine per fornire la capacità riservata. Compute Engine può creare solo prenotazioni con target specifico.
- Eliminazione automatica della prenotazione: indica se vuoi che Compute Engine elimini automaticamente la prenotazione creata automaticamente al termine del periodo di prenotazione. Se vuoi eliminare manualmente la prenotazione, devi contattare il tuo team dell'account.
- Tipo di pianificazione della manutenzione: modalità di pianificazione della manutenzione dell'host da parte di Compute Engine per
le istanze di computing nel cluster. Specifica
una delle seguenti opzioni:
- Per sincronizzare la manutenzione in tutte le istanze A4X Max, A4X, A4 o A3 Ultra nei blocchi riservati, utilizza
GROUPED. - Per utilizzare pianificazioni di manutenzione diverse per le istanze A4 o A3 Ultra, utilizza
INDEPENDENT.
- Per sincronizzare la manutenzione in tutte le istanze A4X Max, A4X, A4 o A3 Ultra nei blocchi riservati, utilizza
- Modalità operativa della prenotazione: indica se tu o Google Cloud gestite il processo di recupero dell'istanza di calcolo dopo un errore dell'host o una segnalazione di host difettoso. La modalità che utilizzi dipende
dal tipo di macchina che prenoti:
- Tutte le modalità di capacità (
ALL_CAPACITY). Questa modalità è solo per i tipi di macchina A4X Max e A4X. Devi gestire manualmente il processo di manutenzione e ripristino di un'istanza di calcolo. Tuttavia, hai accesso completo a tutte le macchine nella prenotazione, nonché un controllo più granulare sulla topologia e sulla manutenzione dell'istanza di calcolo. - Modalità gestita (
HIGHLY_AVAILABLE_CAPACITY). Questa modalità è solo per i tipi di macchine A4, A3 Ultra, A3 Mega e A3 High. Consenti a Google Cloud di gestire la manutenzione e il processo di recupero per un'istanza di calcolo sostituendo automaticamente le macchine difettose. Questo approccio aumenta la disponibilità delle tue istanze di calcolo e ti aiuta a riavviarle rapidamente su nuovi host. Tuttavia, la topologia delle istanze di computing potrebbe cambiare dopo che Compute Engine sostituisce una macchina.
- Tutte le modalità di capacità (
- Tipo di condivisione: indica se solo il tuo progetto può utilizzare la prenotazione
creata automaticamente (
LOCAL) o se altri progetti possono utilizzare la prenotazione (SPECIFIC_PROJECTS). Questa proprietà non può essere modificata dopo l'invio della richiesta. Per condividere la capacità riservata con altri progetti della tua organizzazione:- Se non l'hai ancora fatto, verifica che il progetto in cui Google crea la richiesta sia autorizzato a creare prenotazioni condivise.
- Fornisci i numeri dei progetti con cui condividere la capacità riservata. Puoi specificare fino a 100 progetti nella tua organizzazione.
Nome dell'impegno: se il periodo di prenotazione è di un anno o più, devi acquistare e collegare un impegno basato sulle risorse alle risorse prenotate. Per i periodi di prenotazione da 1 anno a meno di 3 anni, l'impegno ti offre la tariffa dello sconto per impegno di utilizzo (CUD) di 1 anno. Per i periodi di prenotazione da 3 anni a meno di 6 anni, l'impegno ti offre la tariffa CUD di 3 anni.
Se condividi la capacità riservata con altri progetti, questi ultimi ricevono sconti solo se utilizzano lo stesso account di fatturazione Cloud del progetto in cui prenoti la capacità. Per maggiori dettagli, consulta Attiva la condivisione del CUD per gli impegni basati sulle risorse.
L'impegno ha le stesse date di inizio e di fine della prenotazione, ma gli orari di attivazione potrebbero essere diversi. Se specifichi l'ora di inizio della prenotazione come le 00:00 del fuso orario del Pacifico (Stati Uniti e Canada), l'impegno diventa attivo alle 00:00 della data di inizio scelta. Se specifichi un'ora di inizio diversa, l'impegno diventa attivo alle ore 00:00 del giorno successivo alla data di inizio scelta.
Dopo che Google ha creato la bozza della richiesta di prenotazione futura, il team dell'account ti contatta.
Esamina e invia una bozza di richiesta di prenotazione
Dopo aver fornito al tuo team dell'account il tipo e la quantità di risorse da prenotare, Google crea una bozza di richiesta di prenotazione futura. Puoi esaminare la bozza della richiesta e, se corretta, inviarla per la revisione. Devi inviare la richiesta prima dell'ora di inizio della richiesta.
Per esaminare e inviare una bozza di richiesta di prenotazione futura, seleziona una delle seguenti opzioni:
Console
Nella console Google Cloud , vai alla pagina Prenotazioni.
- Fai clic sulla scheda Prenotazioni future. La tabella Prenotazioni future elenca ogni richiesta di prenotazione futura nel tuo progetto e ogni colonna della tabella descrive una proprietà.
- Nella colonna Nome, fai clic sul nome della richiesta di bozza creata da Google. Viene visualizzata una pagina con i dettagli della richiesta di prenotazione futura.
- Nella sezione Informazioni di base, verifica che i dettagli della richiesta, come Date e Tipo di condivisione, siano corretti. Inoltre, se hai richiesto un impegno, verifica che sia specificato. Se uno di questi dettagli non è corretto, contatta il team dedicato al tuo account.
Se è tutto corretto, invia la richiesta:
- Fai clic su Modifica bozza. Viene visualizzata una pagina per modificare la bozza della richiesta.
- Fai clic su Crea. Viene visualizzata la pagina Prenotazione. Google Cloud approva la tua richiesta in pochi minuti, quindi Compute Engine crea una prenotazione vuota con le risorse richieste.
gcloud
- Per visualizzare un elenco delle richieste di prenotazione futura nel tuo progetto, utilizza il
comando
gcloud compute future-reservations listcon il flag--filterimpostato suPROCUREMENT_STATUS=DRAFTING:gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
- Nell'output del comando, cerca la richiesta di prenotazione con il nome che hai fornito al team dell'account.
- Per visualizzare i dettagli della bozza di richiesta, utilizza il
comando
gcloud compute future-reservations describe:gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \ --zone=ZONESostituisci quanto segue:
FUTURE_RESERVATION_NAME: il nome della bozza di richiesta di prenotazione futura.ZONE: la zona in cui Google ha creato la richiesta.
L'output è simile al seguente:
autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z' creationTimestamp: '2025-11-27T11:14:58.305-08:00' deploymentType: DENSE id: '7979651787097007552' kind: compute#futureReservation name: example-draft-request planningStatus: DRAFT reservationName: example-reservation schedulingType: INDEPENDENT selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552 specificReservationRequired: true specificSkuProperties: instanceProperties: guestAccelerators: - acceleratorCount: 8 acceleratorType: nvidia-h200-141gb localSsds: - diskSizeGb: '375' interface: NVME ... machineType: a3-ultragpu-8g totalCount: '2' status: autoCreatedReservations: - https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation fulfilledCount: '2' lockTime: '2026-01-27T19:15:00Z' procurementStatus: DRAFTING timeWindow: endTime: '2026-02-10T19:20:00Z' startTime: '2026-01-27T19:20:00Z' zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b - Nell'output del comando, verifica che i dettagli della richiesta, come il periodo di prenotazione e il tipo di condivisione, siano corretti. Inoltre, se hai acquistato un impegno, verifica che sia specificato. Se i dettagli non sono corretti, contatta il team dedicato al tuo account.
- Per inviare la bozza di richiesta per la revisione, utilizza il
comando
gcloud compute future-reservations updatecon il flag--planning-statusimpostato suSUBMITTED:gcloud compute future-reservations update FUTURE_RESERVATION_NAME \ --planning-status=SUBMITTED \ --zone=ZONEEntro pochi minuti, Google Cloud approva la tua richiesta e poi Compute Engine crea una prenotazione vuota con le risorse richieste.
REST
- Per visualizzare un elenco delle richieste di prenotazione futura nel tuo progetto, invia una richiesta
GETal metodofutureReservations.list. Nell'URL della richiesta, includi il parametro di queryfiltere impostalo sustatus.procurementStatus=DRAFTING:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
Sostituisci quanto segue:
PROJECT_ID: l'ID del progetto in cui Google ha creato la bozza della richiesta di prenotazione futura.ZONE: la zona in cui esiste la richiesta.
- Nell'output della richiesta, cerca la richiesta di prenotazione con il nome che hai fornito al tuo team dell'account.
- Per visualizzare i dettagli della bozza di richiesta, invia una richiesta
GETal metodofutureReservations.getbeta:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
Sostituisci
FUTURE_RESERVATION_NAMEcon il nome della bozza della richiesta di prenotazione futura.L'output è simile al seguente:
{ "specificSkuProperties": { "instanceProperties": { "machineType": "a3-ultragpu-8g", "guestAccelerators": [ { "acceleratorType": "nvidia-h200-141gb", "acceleratorCount": 8 } ], "localSsds": [ { "diskSizeGb": "375", "interface": "NVME" }, ... ] }, "totalCount": "2" }, "kind": "compute#futureReservation", "id": "7979651787097007552", "creationTimestamp": "2025-11-27T11:14:58.305-08:00", "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request", "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552", "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b", "name": "example-draft-request", "timeWindow": { "startTime": "2026-01-27T19:20:00Z", "endTime": "2026-02-10T19:20:00Z" }, "status": { "procurementStatus": "DRAFTING", "lockTime": "2026-01-27T19:15:00Z" }, "planningStatus": "DRAFT", "specificReservationRequired": true, "reservationName": "example-reservation", "deploymentType": "DENSE", "schedulingType": "INDEPENDENT", "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z" } - Nell'output, verifica che i dettagli della richiesta, come il periodo di prenotazione e il tipo di condivisione, siano corretti. Inoltre, se hai richiesto un impegno, verifica che sia specificato. Se i dettagli non sono corretti, contatta il team dedicato al tuo account.
- Per inviare la bozza della richiesta per la revisione, invia una richiesta
PATCHal metodofutureReservations.updatebeta. Nell'URL della richiesta, includi il parametro di queryupdateMaske impostalo suplanningStatus:PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus { "name": "FUTURE_RESERVATION_NAME", "planningStatus": "SUBMITTED" }Entro pochi minuti, Google Cloud approva la tua richiesta e Compute Engine crea una prenotazione vuota con le risorse richieste.
Passaggi successivi
Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2026-03-14 UTC.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2026-03-14 UTC."],[],[]] -
Per consentire a Compute Engine di creare in automatico le prenotazioni: