Prenotare la capacità tramite il team dell'account

Questo documento spiega come ottenere la capacità quando vuoi utilizzare le prenotazioni future nell'opzione di utilizzo di AI Hypercomputer. Per scoprire tutte le opzioni di capacità in AI Hypercomputer, consulta la panoramica della capacità.

Per avere la certezza che i tuoi carichi di lavoro dispongano delle risorse necessarie, richiedi una prenotazione futura a Google. Questa azione ti consente di prenotare blocchi di capacità per una durata definita, a partire da una data e un'ora specifiche che scegli. In base alla tua richiesta, Google crea una bozza di richiesta di prenotazione futura. Dopo aver esaminato e inviato questa bozza di richiesta e che Google Cloud l'ha approvata, Compute Engine crea automaticamente (crea automaticamente) una prenotazione vuota. Poi, all'ora di inizio scelta, Compute Engine esegue il provisioning della capacità richiesta nella prenotazione creata automaticamente. Puoi quindi utilizzare la prenotazione per creare istanze Compute Engine fino al termine del periodo di prenotazione.

Limitazioni

Questa sezione descrive le limitazioni per le richieste di prenotazione futura e per la prenotazione creata automaticamente per una richiesta.

Limitazioni per le richieste di prenotazione futura

Dopo che Google ha creato una bozza di richiesta di prenotazione futura per te, si applicano le seguenti limitazioni:

  • Non puoi modificare i dettagli della richiesta, incluso il tipo di condivisione.
  • Una volta inviata e approvata la richiesta e il suo stato cambia in PROVISIONING, non puoi annullarla o eliminarla. Ti impegni a pagare la capacità richiesta a partire dall'ora di inizio della richiesta, indipendentemente dall'utilizzo.

Limitazioni per le prenotazioni create automaticamente

Dopo che Compute Engine crea una prenotazione on demand per soddisfare la capacità richiesta, si applicano le seguenti limitazioni:

Prima di iniziare

  • Se non l'hai ancora fatto, controlla le configurazioni di VM e cluster disponibili.

  • Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

    At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.

    REST

    Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.

      Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:

      gcloud init

      Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.

    Per saperne di più, consulta Autenticati per usare REST nella documentazione sull'autenticazione di Google Cloud .

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare una richiesta di prenotazione futura, chiedi all'amministratore di concederti il ruolo IAM Compute Future Reservation User (roles/compute.futureReservationUser) sul progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene le autorizzazioni necessarie per creare una richiesta di prenotazione futura. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per creare una richiesta di prenotazione futura, sono necessarie le seguenti autorizzazioni:

  • Per consentire a Compute Engine di creare in automatico le prenotazioni: compute.reservations.create sul progetto
  • Per creare una richiesta di prenotazione futura: compute.futureReservations.create sul progetto
  • Per specificare un modello di istanza: compute.instanceTemplates.useReadOnly sul template di istanza

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Quota

Nell'ambito della procedura di richiesta di prenotazione futura, Google gestisce la quota delle risorse prenotate. Non è necessario richiedere una quota. All'ora di inizio della prenotazione futura approvata, Google aumenta automaticamente la quota se il progetto non dispone di risorse sufficienti per le risorse prenotate.

Panoramica

Per prenotare blocchi di capacità, completa i seguenti passaggi:

  1. Richiedi capacità tramite il tuo team dell'account. Contatta il team dedicato al tuo account per specificare il tipo e il numero di risorse che vuoi prenotare.
  2. Rivedi e invia una bozza di richiesta di prenotazione. Dopo che Google ha creato una bozza di richiesta di prenotazione futura, esaminala. Se ti sembra corretto, invia la richiesta di revisione. Google Cloud lo approva immediatamente.

Richiedere capacità tramite il team dell'account

Contatta il team dedicato al tuo account e fornisci le seguenti informazioni per consentire a Google di creare una bozza di richiesta di prenotazione futura:

  • Numero di progetto: il numero del progetto in cui il team dedicato al tuo account crea la richiesta e Compute Engine esegue il provisioning della capacità.
  • Tipo di macchina: il tipo di macchina da prenotare. Puoi specificare uno dei seguenti valori:
    • A4X Max (a4x-maxgpu-4g-metal)
    • A4X (a4x-highgpu-4g)
    • A4 (a4-highgpu-8g)
    • A3 Ultra (a3-ultragpu-8g)
    • A3 Mega (a3-megagpu-8g)
    • A3 High (a3-highgpu-8g)
  • Zona: la zona in cui vuoi prenotare la capacità. Per esaminare le regioni e le zone disponibili per un tipo di macchina GPU, consulta la sezione Disponibilità degli acceleratori.
  • Conteggio totale: il numero totale di istanze di calcolo da prenotare. Puoi prenotare solo multipli di due istanze di computing. Le dimensioni dei blocchi e il numero di istanze di computing per blocco variano in base al tipo di macchina e alla disponibilità. Il team dedicato al tuo account può fornire ulteriori dettagli sulla tua richiesta.
  • Ora di inizio: l'ora di inizio del periodo di prenotazione. Puoi iniziare a utilizzare la capacità riservata in quel momento. Formatta l'ora di inizio come timestamp RFC 3339 nel seguente modo:
    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Sostituisci quanto segue:

    • YYYY-MM-DD: una data formattata come anno a quattro cifre, mese a due cifre e giorno del mese a due cifre, separati da trattini (-).
    • HH:MM:SS: un orario formattato con l'ora a due cifre utilizzando il sistema a 24 ore, i minuti a due cifre e i secondi a due cifre, separati da due punti (:).
    • OFFSET: il fuso orario formattato come offset rispetto al Tempo Universale Coordinato (UTC). Ad esempio, per utilizzare il fuso orario PST (Pacific Standard Time), specifica -08:00. Per non utilizzare alcun offset, specifica Z.
  • Ora di fine: l'ora di fine del periodo di prenotazione. Formatta come timestamp RFC 3339. A questo punto, Compute Engine esegue le seguenti operazioni:
    • Compute Engine elimina la prenotazione creata automaticamente.
    • In base all' azione di terminazione specificata per le istanze di calcolo, Compute Engine arresta o elimina le istanze di calcolo create utilizzando la prenotazione creata automaticamente.
  • Nome prenotazione: il nome della prenotazione creata da Compute Engine per fornire la capacità riservata. Compute Engine può creare solo prenotazioni con target specifico.
  • Eliminazione automatica della prenotazione: indica se vuoi che Compute Engine elimini automaticamente la prenotazione creata automaticamente al termine del periodo di prenotazione. Se vuoi eliminare manualmente la prenotazione, devi contattare il tuo team dell'account.
  • Tipo di pianificazione della manutenzione: modalità di pianificazione della manutenzione dell'host da parte di Compute Engine per le istanze di computing nel cluster. Specifica una delle seguenti opzioni:
    • Per sincronizzare la manutenzione in tutte le istanze A4X Max, A4X, A4 o A3 Ultra nei blocchi riservati, utilizza GROUPED.
    • Per utilizzare pianificazioni di manutenzione diverse per le istanze A4 o A3 Ultra, utilizza INDEPENDENT.
  • Modalità operativa della prenotazione: indica se tu o Google Cloud gestite il processo di recupero dell'istanza di calcolo dopo un errore dell'host o una segnalazione di host difettoso. La modalità che utilizzi dipende dal tipo di macchina che prenoti:
    • Tutte le modalità di capacità (ALL_CAPACITY). Questa modalità è solo per i tipi di macchina A4X Max e A4X. Devi gestire manualmente il processo di manutenzione e ripristino di un'istanza di calcolo. Tuttavia, hai accesso completo a tutte le macchine nella prenotazione, nonché un controllo più granulare sulla topologia e sulla manutenzione dell'istanza di calcolo.
    • Modalità gestita (HIGHLY_AVAILABLE_CAPACITY). Questa modalità è solo per i tipi di macchine A4, A3 Ultra, A3 Mega e A3 High. Consenti a Google Cloud di gestire la manutenzione e il processo di recupero per un'istanza di calcolo sostituendo automaticamente le macchine difettose. Questo approccio aumenta la disponibilità delle tue istanze di calcolo e ti aiuta a riavviarle rapidamente su nuovi host. Tuttavia, la topologia delle istanze di computing potrebbe cambiare dopo che Compute Engine sostituisce una macchina.
  • Tipo di condivisione: indica se solo il tuo progetto può utilizzare la prenotazione creata automaticamente (LOCAL) o se altri progetti possono utilizzare la prenotazione (SPECIFIC_PROJECTS). Questa proprietà non può essere modificata dopo l'invio della richiesta. Per condividere la capacità riservata con altri progetti della tua organizzazione:
    1. Se non l'hai ancora fatto, verifica che il progetto in cui Google crea la richiesta sia autorizzato a creare prenotazioni condivise.
    2. Fornisci i numeri dei progetti con cui condividere la capacità riservata. Puoi specificare fino a 100 progetti nella tua organizzazione.
  • Nome dell'impegno: se il periodo di prenotazione è di un anno o più, devi acquistare e collegare un impegno basato sulle risorse alle risorse prenotate. Per i periodi di prenotazione da 1 anno a meno di 3 anni, l'impegno ti offre la tariffa dello sconto per impegno di utilizzo (CUD) di 1 anno. Per i periodi di prenotazione da 3 anni a meno di 6 anni, l'impegno ti offre la tariffa CUD di 3 anni.

    Se condividi la capacità riservata con altri progetti, questi ultimi ricevono sconti solo se utilizzano lo stesso account di fatturazione Cloud del progetto in cui prenoti la capacità. Per maggiori dettagli, consulta Attiva la condivisione del CUD per gli impegni basati sulle risorse.

    L'impegno ha le stesse date di inizio e di fine della prenotazione, ma gli orari di attivazione potrebbero essere diversi. Se specifichi l'ora di inizio della prenotazione come le 00:00 del fuso orario del Pacifico (Stati Uniti e Canada), l'impegno diventa attivo alle 00:00 della data di inizio scelta. Se specifichi un'ora di inizio diversa, l'impegno diventa attivo alle ore 00:00 del giorno successivo alla data di inizio scelta.

Dopo che Google ha creato la bozza della richiesta di prenotazione futura, il team dell'account ti contatta.

Esamina e invia una bozza di richiesta di prenotazione

Dopo aver fornito al tuo team dell'account il tipo e la quantità di risorse da prenotare, Google crea una bozza di richiesta di prenotazione futura. Puoi esaminare la bozza della richiesta e, se corretta, inviarla per la revisione. Devi inviare la richiesta prima dell'ora di inizio della richiesta.

Per esaminare e inviare una bozza di richiesta di prenotazione futura, seleziona una delle seguenti opzioni:

Console

  1. Nella console Google Cloud , vai alla pagina Prenotazioni.

    Vai a Prenotazioni

  2. Fai clic sulla scheda Prenotazioni future. La tabella Prenotazioni future elenca ogni richiesta di prenotazione futura nel tuo progetto e ogni colonna della tabella descrive una proprietà.
  3. Nella colonna Nome, fai clic sul nome della richiesta di bozza creata da Google. Viene visualizzata una pagina con i dettagli della richiesta di prenotazione futura.
  4. Nella sezione Informazioni di base, verifica che i dettagli della richiesta, come Date e Tipo di condivisione, siano corretti. Inoltre, se hai richiesto un impegno, verifica che sia specificato. Se uno di questi dettagli non è corretto, contatta il team dedicato al tuo account.
  5. Se è tutto corretto, invia la richiesta:

    1. Fai clic su Modifica bozza. Viene visualizzata una pagina per modificare la bozza della richiesta.
    2. Fai clic su Crea. Viene visualizzata la pagina Prenotazione. Google Cloud approva la tua richiesta in pochi minuti, quindi Compute Engine crea una prenotazione vuota con le risorse richieste.

gcloud

  1. Per visualizzare un elenco delle richieste di prenotazione futura nel tuo progetto, utilizza il comando gcloud compute future-reservations list con il flag --filter impostato su PROCUREMENT_STATUS=DRAFTING:
    gcloud compute future-reservations list --filter=PROCUREMENT_STATUS=DRAFTING
    
  2. Nell'output del comando, cerca la richiesta di prenotazione con il nome che hai fornito al team dell'account.
  3. Per visualizzare i dettagli della bozza di richiesta, utilizza il comando gcloud compute future-reservations describe:
    gcloud compute future-reservations describe FUTURE_RESERVATION_NAME \
        --zone=ZONE
    

    Sostituisci quanto segue:

    • FUTURE_RESERVATION_NAME: il nome della bozza di richiesta di prenotazione futura.
    • ZONE: la zona in cui Google ha creato la richiesta.

    L'output è simile al seguente:

    autoCreatedReservationsDeleteTime: '2026-02-10T19:20:00Z'
    creationTimestamp: '2025-11-27T11:14:58.305-08:00'
    deploymentType: DENSE
    id: '7979651787097007552'
    kind: compute#futureReservation
    name: example-draft-request
    planningStatus: DRAFT
    reservationName: example-reservation
    schedulingType: INDEPENDENT
    selfLink: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request
    selfLinkWithId: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552
    specificReservationRequired: true
    specificSkuProperties:
      instanceProperties:
        guestAccelerators:
        -   acceleratorCount: 8
          acceleratorType: nvidia-h200-141gb
        localSsds:
        -   diskSizeGb: '375'
          interface: NVME
        ...
      machineType: a3-ultragpu-8g
    totalCount: '2'
    status:
      autoCreatedReservations:
      -   https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/reservations/example-reservation
      fulfilledCount: '2'
      lockTime: '2026-01-27T19:15:00Z'
      procurementStatus: DRAFTING
    timeWindow:
      endTime: '2026-02-10T19:20:00Z'
      startTime: '2026-01-27T19:20:00Z'
    zone: https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b
    
  4. Nell'output del comando, verifica che i dettagli della richiesta, come il periodo di prenotazione e il tipo di condivisione, siano corretti. Inoltre, se hai acquistato un impegno, verifica che sia specificato. Se i dettagli non sono corretti, contatta il team dedicato al tuo account.
  5. Per inviare la bozza di richiesta per la revisione, utilizza il comando gcloud compute future-reservations update con il flag --planning-status impostato su SUBMITTED:
    gcloud compute future-reservations update FUTURE_RESERVATION_NAME \
        --planning-status=SUBMITTED \
        --zone=ZONE
    

    Entro pochi minuti, Google Cloud approva la tua richiesta e poi Compute Engine crea una prenotazione vuota con le risorse richieste.

REST

  1. Per visualizzare un elenco delle richieste di prenotazione futura nel tuo progetto, invia una richiesta GET al metodo futureReservations.list. Nell'URL della richiesta, includi il parametro di query filter e impostalo su status.procurementStatus=DRAFTING:
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations?filter=status.procurementStatus=DRAFTING
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del progetto in cui Google ha creato la bozza della richiesta di prenotazione futura.
    • ZONE: la zona in cui esiste la richiesta.
  2. Nell'output della richiesta, cerca la richiesta di prenotazione con il nome che hai fornito al tuo team dell'account.
  3. Per visualizzare i dettagli della bozza di richiesta, invia una richiesta GET al metodo futureReservations.get beta:
    GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME
    

    Sostituisci FUTURE_RESERVATION_NAME con il nome della bozza della richiesta di prenotazione futura.

    L'output è simile al seguente:

    {
      "specificSkuProperties": {
        "instanceProperties": {
          "machineType": "a3-ultragpu-8g",
          "guestAccelerators": [
            {
              "acceleratorType": "nvidia-h200-141gb",
              "acceleratorCount": 8
            }
          ],
          "localSsds": [
            {
              "diskSizeGb": "375",
              "interface": "NVME"
            },
            ...
          ]
        },
        "totalCount": "2"
      },
      "kind": "compute#futureReservation",
      "id": "7979651787097007552",
      "creationTimestamp": "2025-11-27T11:14:58.305-08:00",
      "selfLink": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/example-draft-request",
      "selfLinkWithId": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b/futureReservations/7979651787097007552",
      "zone": "https://www.googleapis.com/compute/v1/projects/example-project/zones/europe-west1-b",
      "name": "example-draft-request",
      "timeWindow": {
        "startTime": "2026-01-27T19:20:00Z",
        "endTime": "2026-02-10T19:20:00Z"
      },
      "status": {
        "procurementStatus": "DRAFTING",
        "lockTime": "2026-01-27T19:15:00Z"
      },
      "planningStatus": "DRAFT",
      "specificReservationRequired": true,
      "reservationName": "example-reservation",
      "deploymentType": "DENSE",
      "schedulingType": "INDEPENDENT",
      "autoCreatedReservationsDeleteTime": "2026-02-10T19:20:00Z"
    }
    
  4. Nell'output, verifica che i dettagli della richiesta, come il periodo di prenotazione e il tipo di condivisione, siano corretti. Inoltre, se hai richiesto un impegno, verifica che sia specificato. Se i dettagli non sono corretti, contatta il team dedicato al tuo account.
  5. Per inviare la bozza della richiesta per la revisione, invia una richiesta PATCH al metodo futureReservations.update beta. Nell'URL della richiesta, includi il parametro di query updateMask e impostalo su planningStatus:
    PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations/FUTURE_RESERVATION_NAME?updateMask=planningStatus
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "planningStatus": "SUBMITTED"
    }
    

    Entro pochi minuti, Google Cloud approva la tua richiesta e Compute Engine crea una prenotazione vuota con le risorse richieste.

Passaggi successivi