Questo documento spiega come ottenere la capacità quando vuoi utilizzare le prenotazioni future nell'opzione di utilizzo di AI Hypercomputer. Per scoprire tutte le opzioni di capacità in AI Hypercomputer, consulta la panoramica della capacità.
Per avere la certezza che i tuoi carichi di lavoro dispongano delle risorse necessarie, richiedi una prenotazione futura a Google. Questa azione ti consente di prenotare blocchi di capacità per una durata definita, a partire da una data e un'ora specifiche che scegli. In base alla tua richiesta, Google crea una bozza di richiesta di prenotazione futura. Dopo aver esaminato e inviato questa bozza di richiesta e che Google Cloud l'ha approvata, Compute Engine crea automaticamente (crea automaticamente) una prenotazione vuota. Poi, all'ora di inizio scelta, Compute Engine esegue il provisioning della capacità richiesta nella prenotazione creata automaticamente. Puoi quindi utilizzare la prenotazione per creare istanze Compute Engine fino al termine del periodo di prenotazione.
Limitazioni
Questa sezione descrive le limitazioni per le richieste di prenotazione future e per la prenotazione creata automaticamente per una richiesta.
Limitazioni per le richieste di prenotazione futura
Dopo che Google ha creato una bozza di richiesta di prenotazione futura per te, si applicano le seguenti limitazioni:
- Non puoi modificare i dettagli della richiesta, incluso il tipo di condivisione.
- Una volta inviata e approvata la richiesta e il suo stato è cambiato in
PROVISIONING, non puoi annullarla o eliminarla. Ti impegni a pagare la capacità richiesta a partire dall'ora di inizio della richiesta, indipendentemente dall'utilizzo.
Limitazioni per le prenotazioni create automaticamente
Dopo che Compute Engine crea una prenotazione on demand per soddisfare la capacità richiesta, si applicano le seguenti limitazioni:
- Puoi utilizzare o modificare la prenotazione solo dopo l'ora di inizio della richiesta.
-
Puoi modificare la prenotazione solo come segue:
- Abilita o disabilita l'utilizzo delle prenotazioni in Vertex AI
- Attiva le notifiche di manutenzione di emergenza dell'hardware
Per modificare altre proprietà in una prenotazione, devi contattare il tuo team dedicato all'account.
- Non puoi eliminare manualmente la prenotazione. Se, quando prenoti la capacità, specifichi che non vuoi eliminare automaticamente la prenotazione al termine del periodo di prenotazione, devi contattare il team dedicato all'account per eliminare la prenotazione.
Prima di iniziare
Se non l'hai ancora fatto, controlla le configurazioni di VM e cluster disponibili.
-
Seleziona la scheda relativa a come intendi utilizzare i campioni in questa pagina:
Console
Quando utilizzi la console Google Cloud per accedere ai servizi Google Cloud e alle API, non devi configurare l'autenticazione.
gcloud
Nella console Google Cloud , attiva Cloud Shell.
Nella parte inferiore della console Google Cloud viene avviata una sessione di Cloud Shell e viene visualizzato un prompt della riga di comando. Cloud Shell è un ambiente shell con Google Cloud CLI già installata e con valori già impostati per il progetto corrente. L'inizializzazione della sessione può richiedere alcuni secondi.
REST
Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.
Installa Google Cloud CLI.
Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
Per saperne di più, consulta Autenticati per usare REST nella documentazione sull'autenticazione di Google Cloud .
Ruoli obbligatori
Per ottenere le autorizzazioni
necessarie per creare una richiesta di prenotazione futura,
chiedi all'amministratore di concederti il
ruolo IAM Compute Future Reservation User (roles/compute.futureReservationUser) sul progetto.
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Questo ruolo predefinito contiene le autorizzazioni necessarie per creare una richiesta di prenotazione futura. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per creare una richiesta di prenotazione futura, sono necessarie le seguenti autorizzazioni:
-
Per consentire a Compute Engine di creare in automatico le prenotazioni:
compute.reservations.createsul progetto -
Per creare una richiesta di prenotazione futura:
compute.futureReservations.createsul progetto -
Per specificare un modello di istanza:
compute.instanceTemplates.useReadOnlysul template di istanza
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Quota
Nell'ambito della procedura di richiesta di prenotazione futura, Google gestisce la quota delle risorse prenotate. Non è necessario richiedere una quota. All'ora di inizio della prenotazione futura approvata, Google aumenta automaticamente la quota se il progetto non dispone di risorse sufficienti per le risorse prenotate.
Panoramica
Per prenotare blocchi di capacità, completa i seguenti passaggi:
- Richiedi capacità tramite il tuo team dedicato all'account. Contatta il team dedicato all'account per specificare il tipo e il numero di risorse che vuoi prenotare.
- Rivedi e invia una bozza di richiesta di prenotazione. Dopo che Google ha creato una bozza di richiesta di prenotazione futura, esaminala. Se ti sembra corretto, invia la richiesta di revisione. Google Cloud lo approva immediatamente.
Richiedere capacità tramite il team dell'account
Contatta il team dedicato all'account e fornisci le seguenti informazioni per consentire a Google di creare una bozza di richiesta di prenotazione futura:
- Numero di progetto: il numero del progetto in cui il team dedicato all'account crea la richiesta e Compute Engine esegue il provisioning della capacità.
- Tipo di macchina: il tipo di macchina da prenotare. Puoi specificare uno dei seguenti valori:
- A4X Max (
a4x-maxgpu-4g-metal) - A4X (
a4x-highgpu-4g) - A4 (
a4-highgpu-8g) - A3 Ultra (
a3-ultragpu-8g) - A3 Mega (
a3-megagpu-8g) - A3 High (
a3-highgpu-8g)
- A4X Max (
- Zona: la zona in cui vuoi prenotare la capacità. Per esaminare le regioni e le zone disponibili per un tipo di macchina GPU, consulta la sezione Disponibilità degli acceleratori.
- Conteggio totale: il numero totale di istanze di calcolo da prenotare. Puoi prenotare solo multipli di due istanze di computing. Le dimensioni dei blocchi e il numero di istanze di computing per blocco variano in base al tipo di macchina e alla disponibilità. Il team dedicato all'account può fornire ulteriori dettagli sulla tua richiesta.
- Ora di inizio: l'ora di inizio del periodo di prenotazione. Puoi iniziare a utilizzare la capacità
riservata in quel momento. Formatta l'ora di inizio come timestamp RFC 3339 nel seguente modo:
YYYY-MM-DDTHH:MM:SSOFFSET
Sostituisci quanto segue:
YYYY-MM-DD: una data formattata come anno a quattro cifre, mese a due cifre e giorno del mese a due cifre, separati da trattini (-).HH:MM:SS: un orario formattato con l'ora a due cifre utilizzando il sistema a 24 ore, i minuti a due cifre e i secondi a due cifre, separati da due punti (:).OFFSET: il fuso orario formattato come offset rispetto al Tempo Universale Coordinato (UTC). Ad esempio, per utilizzare il fuso orario PST (Pacific Standard Time), specifica-08:00. Per non utilizzare alcun offset, specificaZ.
- Ora di fine: l'ora di fine del periodo di prenotazione. Formatta come timestamp RFC 3339. A
questo punto, Compute Engine esegue le seguenti operazioni:
- Compute Engine elimina la prenotazione creata automaticamente.
- In base all' azione di terminazione specificata per le istanze di calcolo, Compute Engine arresta o elimina le istanze di calcolo create utilizzando la prenotazione creata automaticamente.
- Nome prenotazione: il nome della prenotazione creata da Compute Engine per fornire la capacità riservata. Compute Engine può creare solo prenotazioni con target specifico.
- Eliminazione automatica della prenotazione: indica se vuoi che Compute Engine elimini automaticamente la prenotazione creata automaticamente al termine del periodo di prenotazione. Se vuoi eliminare manualmente la prenotazione, devi contattare il tuo team dedicato all'account per eliminare la prenotazione.
- Tipo di pianificazione della manutenzione: modalità di pianificazione della manutenzione dell'host da parte di Compute Engine per
le istanze di computing nel cluster. Specifica
una delle seguenti opzioni:
- Per sincronizzare la manutenzione in tutte le istanze A4X Max, A4X, A4 o A3 Ultra nei blocchi riservati, utilizza
GROUPED. - Per utilizzare pianificazioni di manutenzione diverse per le istanze A4 o A3 Ultra, utilizza
INDEPENDENT.
- Per sincronizzare la manutenzione in tutte le istanze A4X Max, A4X, A4 o A3 Ultra nei blocchi riservati, utilizza
- Modalità operativa della prenotazione: indica se tu o Google Cloud gestite il processo di recupero dell'istanza di calcolo dopo un errore dell'host o una segnalazione di host difettoso. La modalità che utilizzi dipende
dal tipo di macchina che prenoti:
- Tutte le modalità di capacità (
ALL_CAPACITY). Questa modalità è solo per i tipi di macchina A4X Max e A4X. Devi gestire manualmente il processo di manutenzione e ripristino di un'istanza di calcolo. Tuttavia, hai accesso completo a tutte le macchine nella prenotazione, nonché un controllo più granulare sulla topologia e sulla manutenzione dell'istanza di computing. - Modalità gestita (
HIGHLY_AVAILABLE_CAPACITY). Questa modalità è solo per i tipi di macchine A4, A3 Ultra, A3 Mega e A3 High. Consenti a Google Cloud di gestire la manutenzione e il processo di recupero per un'istanza di computing sostituendo automaticamente le macchine difettose. Questo approccio aumenta la disponibilità delle tue istanze di calcolo e ti aiuta a riavviarle rapidamente su nuovi host. Tuttavia, la topologia delle istanze di computing potrebbe cambiare dopo che Compute Engine sostituisce una macchina.
- Tutte le modalità di capacità (
- Tipo di condivisione: indica se solo il tuo progetto può utilizzare la prenotazione
creata automaticamente (
LOCAL) o se altri progetti possono utilizzare la prenotazione (SPECIFIC_PROJECTS). Questa proprietà non può essere modificata dopo l'invio della richiesta. Per condividere la capacità riservata con altri progetti della tua organizzazione:- Se non l'hai ancora fatto, verifica che il progetto in cui Google crea la richiesta sia autorizzato a creare prenotazioni condivise.
- Fornisci i numeri dei progetti con cui condividere la capacità riservata. Puoi specificare fino a 100 progetti nella tua organizzazione.
Nome dell'impegno: se il periodo di prenotazione è di un anno o più, devi acquistare e collegare un impegno basato sulle risorse alle risorse prenotate. Per i periodi di prenotazione da 1 anno a meno di 3 anni, l'impegno ti offre la tariffa dello sconto per impegno di utilizzo (CUD) di 1 anno. Per i periodi di prenotazione da 3 anni a meno di 6 anni, l'impegno ti offre la tariffa CUD di 3 anni.
Se condividi la capacità riservata con altri progetti, questi ultimi ricevono sconti solo se utilizzano lo stesso account di fatturazione Cloud del progetto in cui prenoti la capacità. Per maggiori dettagli, consulta Attiva la condivisione del CUD per gli impegni basati sulle risorse.
L'impegno ha le stesse date di inizio e di fine della prenotazione, ma gli orari di attivazione potrebbero essere diversi. Se specifichi l'ora di inizio della prenotazione come le 00:00 del fuso orario del Pacifico (Stati Uniti e Canada), l'impegno diventa attivo alle 00:00 della data di inizio scelta. Se specifichi un'ora di inizio diversa, l'impegno diventa attivo alle ore 00:00 del giorno successivo alla data di inizio scelta.
Dopo che Google ha creato la bozza della richiesta di prenotazione futura, il team dedicato all'account ti contatta.
Esamina e invia una bozza di richiesta di prenotazione
Dopo aver fornito al tuo team dedicato all'account il tipo e la quantità di risorse da prenotare, Google crea una bozza di richiesta di prenotazione futura. Puoi esaminare la bozza della richiesta e, se corretta, inviarla per la revisione. Devi inviare la richiesta prima dell'ora di inizio della richiesta.
Per esaminare e inviare una bozza di richiesta di prenotazione futura, seleziona una delle seguenti opzioni:
Console
Nella console Google Cloud , vai alla pagina Prenotazioni.
- Fai clic sulla scheda Prenotazioni future. La tabella Prenotazioni future elenca ogni richiesta di prenotazione futura nel tuo progetto e ogni colonna della tabella descrive una proprietà.
- Nella colonna Nome, fai clic sul nome della richiesta di bozza creata da Google. Viene visualizzata una pagina con i dettagli della richiesta di prenotazione futura.
- Nella sezione Informazioni di base, verifica che i dettagli della richiesta, come Date e Tipo di condivisione, siano corretti. Inoltre, se hai richiesto un impegno, verifica che sia specificato. Se uno di questi dettagli non è corretto, contatta il team dedicato al tuo account.
Se è tutto corretto, invia la richiesta:
- Fai clic su Modifica bozza. Viene visualizzata una pagina per modificare la bozza della richiesta.
- Fai clic su Crea. Viene visualizzata la pagina Prenotazione. Google Cloud approva la tua richiesta in pochi minuti, quindi Compute Engine crea una prenotazione vuota con le risorse richieste.
gcloud
- Per visualizzare un elenco delle richieste di prenotazione futura nel tuo progetto, utilizza il
comando
gcloud compute future-reservations listcon il flag--filterimpostato suPROCUREMENT_STATUS=DRAFTING:gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
- Nell'output comando, cerca la richiesta di prenotazione con il nome che hai fornito al team dedicato all'account.
- Per visualizzare i dettagli della bozza di richiesta, utilizza il
comando
gcloud compute future-reservations describe:gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \ --zone=ZONESostituisci quanto segue:
FUTURE_RESERVATION_NAME: il nome della bozza di richiesta di prenotazione futura.ZONE: la zona in cui Google ha creato la richiesta.
L'output è simile al seguente:
autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z' creationTimestamp: '2025-11-27T11:14:58.305-08:00' deploymentType: DENSE id: '7979651787097007552' kind: compute#futureReservation name: example-draft-request planningStatus: DRAFT reservationName: example-reservation schedulingType: INDEPENDENT selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552 specificReservationRequired: true specificSkuProperties: instanceProperties: guestAccelerators: - acceleratorCount: 8 acceleratorType: nvidia-h200-141gb localSsds: - diskSizeGb: '375' interface: NVME ... machineType: a3-ultragpu-8g totalCount: '2' status: autoCreatedReservations: - https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation fulfilledCount: '2' lockTime: '2026-01-27T19:15:00Z' procurementStatus: DRAFTING timeWindow: endTime: '2026-02-10T19:20:00Z' startTime: '2026-01-27T19:20:00Z' zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b - Nell'output del comando, verifica che i dettagli della richiesta, come il periodo di prenotazione e il tipo di condivisione, siano corretti. Inoltre, se hai acquistato un impegno, verifica che sia specificato. Se i dettagli non sono corretti, contatta il team dedicato al tuo account.
- Per inviare la bozza di richiesta per la revisione, utilizza il
comando
gcloud compute future-reservations updatecon il flag--planning-statusimpostato suSUBMITTED:gcloud compute future-reservations update FUTURE_RESERVATION_NAME \ --planning-status=SUBMITTED \ --zone=ZONEEntro pochi minuti, Google Cloud approva la tua richiesta e poi Compute Engine crea una prenotazione vuota con le risorse richieste.
REST
- Per visualizzare un elenco delle richieste di prenotazione futura nel tuo progetto, invia una richiesta
GETal metodofutureReservations.list. Nell'URL della richiesta, includi il parametro di queryfiltere impostalo sustatus.procurementStatus=DRAFTING:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
Sostituisci quanto segue:
PROJECT_ID: l'ID del progetto in cui Google ha creato la bozza della richiesta di prenotazione futura.ZONE: la zona in cui esiste la richiesta.
- Nell'output della richiesta, cerca la richiesta di prenotazione con il nome che hai fornito al tuo team dedicato all'account.
- Per visualizzare i dettagli della bozza di richiesta, invia una richiesta
GETal metodofutureReservations.getbeta:GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
Sostituisci
FUTURE_RESERVATION_NAMEcon il nome della bozza della richiesta di prenotazione futura.L'output è simile al seguente:
{ "specificSkuProperties": { "instanceProperties": { "machineType": "a3-ultragpu-8g", "guestAccelerators": [ { "acceleratorType": "nvidia-h200-141gb", "acceleratorCount": 8 } ], "localSsds": [ { "diskSizeGb": "375", "interface": "NVME" }, ... ] }, "totalCount": "2" }, "kind": "compute#futureReservation", "id": "7979651787097007552", "creationTimestamp": "2025-11-27T11:14:58.305-08:00", "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request", "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552", "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b", "name": "example-draft-request", "timeWindow": { "startTime": "2026-01-27T19:20:00Z", "endTime": "2026-02-10T19:20:00Z" }, "status": { "procurementStatus": "DRAFTING", "lockTime": "2026-01-27T19:15:00Z" }, "planningStatus": "DRAFT", "specificReservationRequired": true, "reservationName": "example-reservation", "deploymentType": "DENSE", "schedulingType": "INDEPENDENT", "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z" } - Nell'output, verifica che i dettagli della richiesta, come il periodo di prenotazione e il tipo di condivisione, siano corretti. Inoltre, se hai richiesto un impegno, verifica che sia specificato. Se i dettagli non sono corretti, contatta il team dedicato al tuo account.
- Per inviare la bozza della richiesta per la revisione, invia una richiesta
PATCHal metodofutureReservations.updatebeta. Nell'URL della richiesta, includi il parametro di queryupdateMaske impostalo suplanningStatus:PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus { "name": "FUTURE_RESERVATION_NAME", "planningStatus": "SUBMITTED" }Entro pochi minuti, Google Cloud approva la tua richiesta e Compute Engine crea una prenotazione vuota con le risorse richieste.