Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Creare una richiesta di prenotazione futura in modalità calendario

Questo documento spiega come creare una richiesta di prenotazione futura in modalità calendario per prenotare risorse GPU, H4D o TPU per le istanze di macchine virtuali (VM). Utilizza queste richieste per ottenere risorse ad alta domanda per la creazione di VM che prevedi di eseguire per un massimo di 90 giorni.

Puoi utilizzare le richieste di prenotazione futura in modalità calendario per prenotare risorse per eseguire i seguenti carichi di lavoro:

Job di pre-addestramento dei modelli
Job di ottimizzazione dei modelli
Workload di simulazione di computing ad alte prestazioni (HPC)
Aumenti a breve termine dei workload di inferenza

Dopo che Google Cloud approva la richiesta, le risorse prenotate diventano disponibili per la creazione di VM GPU, H4D o TPU nella data e nell'ora di consegna specificate. Per la durata del periodo di prenotazione, solo il tuo progetto e gli eventuali progetti specificati al momento della creazione della richiesta hanno accesso alle risorse prenotate. Puoi condividere le risorse prenotate con un massimo di 100 progetti che si trovano nella stessa organizzazione del tuo progetto. Per scoprire di più sui requisiti e sulle limitazioni che applichi quando crei una richiesta in modalità calendario, consulta Panoramica delle richieste di prenotazione futura in modalità calendario.

Prima di iniziare

Se non riesci a utilizzare le richieste di prenotazione futura in modalità calendario, potresti non avere l'idoneità all'accesso e all'utilizzo di questa funzionalità. In questo caso, contatta il tuo team dedicato all'account o il team di vendita.
Per prenotare VM H4D, devi disporre di una quota CPU sufficiente. In caso contrario, la prenotazione delle risorse non andrà a buon fine. La quota non è necessaria per riservare VM GPU o TPU.
Per condividere la capacità prenotata con altri progetti all'interno della tua organizzazione, verifica che il progetto in cui vuoi creare richieste di prenotazione future in modalità calendario possa creare prenotazioni condivise. In caso contrario, si verificano degli errori.
Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione verifica la tua identità per l'accesso ad API e servizi Google Cloud . Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:
Seleziona la scheda relativa a come intendi utilizzare i campioni in questa pagina:
Console

Quando utilizzi la console Google Cloud per accedere ai servizi Google Cloud e alle API, non devi configurare l'autenticazione.
gcloud
1. Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:
  gcloud init
  Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
  
  Nota:se hai installato gcloud CLI in precedenza, assicurati di avere l'ultima versione eseguendo gcloud components update.
Imposta una regione e una zona predefinite.

REST

Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.

Installa Google Cloud CLI.

Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.

Per saperne di più, consulta Autenticati per usare REST nella documentazione sull'autenticazione di Google Cloud .

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare una richiesta di prenotazione futura in modalità calendario, chiedi all'amministratore di concederti il ruolo IAM Compute Future Reservation User (roles/compute.futureReservationUser) sul progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene le autorizzazioni necessarie per creare una richiesta di prenotazione futura in modalità calendario. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per creare una richiesta di prenotazione futura in modalità calendario, sono necessarie le seguenti autorizzazioni:

Per creare una richiesta di prenotazione futura: compute.futureReservations.create sul progetto
Per consentire a Compute Engine di creare automaticamente le prenotazioni: compute.reservations.create sul progetto
Per visualizzare la disponibilità delle risorse in una data futura: compute.advice.calendarMode sul progetto

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Creare una richiesta di prenotazione futura in modalità calendario

Per creare una richiesta di prenotazione futura in modalità calendario, completa i seguenti passaggi:

Visualizzare la disponibilità futura delle risorse. Visualizza la disponibilità futura delle VM GPU, delle VM H4D o delle TPU che vuoi prenotare. Poi, quando crei una richiesta, specifica il numero, il tipo e la durata della prenotazione delle risorse che hai confermato come disponibili. Google Cloud ha più probabilità di approvare la tua richiesta se fornisci queste informazioni.

Nota: se crei una richiesta utilizzando la console Google Cloud , salta questo passaggio. Puoi visualizzare la disponibilità futura di VM GPU, VM H4D o TPU durante la creazione della richiesta.

Per istruzioni, vedi Visualizzare la disponibilità futura delle risorse.
Crea una richiesta di prenotazione. Crea e invia una richiesta di prenotazione futura in modalità calendario per VM GPU, VM H4D o TPU. Se riesci a creare una richiesta, Google Cloud la approva entro un minuto.

Per istruzioni, consulta Crea una richiesta per VM GPU, VM H4D o TPU.

Visualizzare la disponibilità futura delle risorse

Puoi visualizzare la disponibilità futura di VM GPU, VM H4D o TPU in una regione nel seguente modo:

Per le VM GPU o H4D, fino a 60 giorni prima
Per le TPU, fino a 120 giorni di anticipo

Per visualizzare la disponibilità futura di VM GPU, VM H4D o TPU in una regione, seleziona una delle seguenti opzioni:

Console

Puoi visualizzare la disponibilità futura di VM GPU, VM H4D o TPU in una regione quando crei una richiesta di prenotazione futura in modalità calendario. Per saperne di più, consulta Crea una richiesta per VM GPU, VM H4D o TPU in questo documento.

gcloud

Per visualizzare la disponibilità futura di VM GPU, VM H4D o TPU in una regione, utilizza il comando gcloud compute advice calendar-mode. In base alle risorse che vuoi visualizzare, includi i seguenti flag:

Per visualizzare la disponibilità di VM GPU o VM H4D, includi i flag --vm-count e --machine-type:

gcloud compute advice calendar-mode \
    --vm-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Per visualizzare la disponibilità delle TPU, includi i flag --chip-count e --tpu-version:

gcloud compute advice calendar-mode \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --duration-range=min=MIN_DURATION,max=MAX_DURATION

Sostituisci quanto segue:

NUMBER_OF_VMS: il numero di VM da prenotare. Il valore deve essere almeno 1 e non maggiore di 80 per le VM GPU o 256 per le VM H4D.
MACHINE_TYPE: il tipo di macchina GPU o H4D da prenotare. Specifica uno dei seguenti valori:
- Per i tipi di macchine A4, specifica a4-highgpu-8g.
- Per i tipi di macchine A3 Ultra, specifica a3-ultragpu-8g.
- Per i tipi di macchine A3 Mega, specifica a3-megagpu-8g.
- Per i tipi di macchine A3 High con 8 GPU, specifica a3-highgpu-8g.
- Per i tipi di macchine H4D HPC, vedi Tipi di macchine H4D.
NUMBER_OF_CHIPS: il numero di chip TPU da prenotare. Il valore deve essere 1, 4, 8, 16, 32, 64, 128, 256, 512, o 1024.
TPU_VERSION: la versione TPU da prenotare. Specifica uno tra i seguenti valori:
- Per TPU7x: TPU7X
- Per TPU v6e: V6E
- Per TPU v5p: V5P
- Per TPU v5e: V5E
Se specifichi una TPU v5e, devi includere il flag --workload-type. Imposta questo flag sul tipo di workload che vuoi eseguire sulle TPU:
- Per i carichi di lavoro che gestiscono grandi quantità di dati in una o più operazioni, come i carichi di lavoro di addestramento del machine learning (ML), specifica BATCH.
- Per i carichi di lavoro che gestiscono richieste simultanee e richiedono una latenza di rete minima, come i carichi di lavoro di inferenza ML, specifica SERVING.
  
  Nota: se specifichi SERVING, puoi prenotare solo 1, 4 o 8 chip TPU v5e.
REGION: la regione in cui prenotare VM GPU, VM H4D o TPU. Per verificare quali regioni e zone sono supportate, consulta Limitazioni.
FROM_START_TIME e TO_START_TIME: le date più vicine e più lontane in cui vuoi prenotare la capacità. Formatta queste date come timestamp RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Sostituisci quanto segue:
- YYYY-MM-DD: una data formattata come anno a quattro cifre, mese a due cifre e giorno a due cifre, separati da trattini (-).
- HH:MM:SS: un orario formattato con l'ora a due cifre utilizzando il sistema a 24 ore, i minuti a due cifre e i secondi a due cifre, separati da due punti (:).
- OFFSET: il fuso orario formattato come offset rispetto al Tempo Universale Coordinato (UTC). Ad esempio, per utilizzare il fuso orario standard della costa del Pacifico (PST), specifica -08:00. Per non utilizzare alcun offset, specifica Z.
MIN_DURATION e MAX_DURATION: l'intervallo di tempo minimo e massimo per cui vuoi prenotare le risorse. Devi formattare questi valori come numero di giorni, ore, minuti o secondi seguito rispettivamente da d, h, m e s. Ad esempio, specifica 24h per 24 ore o 1d2h3m4s per un giorno, due ore, tre minuti e quattro secondi.

L'output è simile al seguente:

- recommendationsPerSpec:
    spec:
      endTime: '2026-02-10T00:00:00Z'
      location: zones/us-central1-a
      otherLocations:
        zones/us-central1-b:
          details: Recommendation in this zone is possible.
          status: RECOMMENDED
        zones/us-central1-c:
          details: Temporarily no free capacity in this zone in the
          requested time window.
          status: NO_CAPACITY
        zones/us-central1-f:
          details: This machine family is not supported in this zone.
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2026-02-07T00:00:00Z'

Se le risorse richieste sono disponibili, l'output contiene i campi startTime, endTime e location. Questi campi specificano l'ora di inizio più recente, l'ora di fine più recente e le zone in cui le risorse sono disponibili.

REST

Per visualizzare la disponibilità futura di VM GPU, VM H4D o TPU in una regione, invia una richiesta GET al metodo advice.calendarMode. In base alle risorse che vuoi visualizzare, includi i seguenti campi nel corpo della richiesta:

Per visualizzare la disponibilità di VM GPU o VM H4D, includi i campi instanceCount e machineType:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "specificSkuResources": {
          "instanceCount": "NUMBER_OF_VMS",
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Per visualizzare la disponibilità delle TPU, includi i campi acceleratorCount e vmFamily:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "aggregateResources": {
          "acceleratorCount": "NUMBER_OF_CHIPS",
          "vmFamily": "TPU_VERSION"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "minDuration": "MIN_DURATION",
        "maxDuration": "MAX_DURATION"
      }
    }
  }
}

Sostituisci quanto segue:

PROJECT_ID: l'ID del progetto in cui vuoi prenotare le risorse.
REGION: la regione in cui vuoi prenotare VM con GPU, VM H4D o TPU. Per controllare le regioni e le zone supportate, consulta Limitazioni.
NUMBER_OF_VMS: il numero di VM con GPU o H4D da prenotare. Per le VM con GPU, il valore deve essere compreso tra 1 e 80. Per le VM H4D, il valore deve essere compreso tra 1 e 256.
MACHINE_TYPE: il tipo di macchina GPU o H4D da prenotare. Specifica uno dei seguenti valori:
- Per i tipi di macchine A4, specifica a4-highgpu-8g.
- Per i tipi di macchine A3 Ultra, specifica a3-ultragpu-8g.
- Per i tipi di macchine A3 Mega, specifica a3-megagpu-8g.
- Per i tipi di macchine A3 High con 8 GPU, specifica a3-highgpu-8g.
- Per i tipi di macchine H4D HPC, vedi Tipi di macchine H4D.
NUMBER_OF_CHIPS: il numero di chip TPU da prenotare. Il valore deve essere 1, 4, 8, 16, 32, 64, 128, 256, 512, o 1024.
TPU_VERSION: la versione TPU da prenotare. Specifica uno tra i seguenti valori:
- Per TPU7x: VM_FAMILY_CLOUD_TPU_POD_SLICE_TPU7X
- Per TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- Per TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
- Per TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Se specifichi una TPU v5e, nel campo aggregateResources devi includere il campo workloadType. Imposta questo campo sul tipo di workload che vuoi eseguire sulle TPU:
- Per i carichi di lavoro che gestiscono grandi quantità di dati in una o più operazioni, come i carichi di lavoro di addestramento del machine learning (ML), specifica BATCH.
- Per i carichi di lavoro che gestiscono richieste simultanee e richiedono una latenza di rete minima, come i carichi di lavoro di inferenza ML, specifica SERVING.
  
  Nota: se specifichi SERVING, puoi prenotare solo 1, 4 o 8 chip TPU v5e.
FROM_START_TIME e TO_START_TIME: le date più vicine e più lontane in cui vuoi prenotare la capacità. Formatta queste date come timestamp RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Sostituisci quanto segue:
- YYYY-MM-DD: una data formattata come anno a 4 cifre, mese a 2 cifre e giorno a 2 cifre, separati da trattini (-).
- HH:MM:SS: un orario formattato con l'ora a due cifre utilizzando il sistema a 24 ore, i minuti a due cifre e i secondi a due cifre, separati da due punti (:).
- OFFSET: il fuso orario formattato come offset rispetto al Tempo Universale Coordinato (UTC). Ad esempio, per utilizzare il fuso orario standard della costa del Pacifico (PST), specifica -08:00. Per non utilizzare alcun offset, specifica Z.
MIN_DURATION e MAX_DURATION: la quantità minima e massima di tempo, in secondi, per cui vuoi prenotare le risorse. Devi formattare questi valori come numero di secondi, seguito da s. Ad esempio, specifica 86400s per 86.400 secondi (24 ore).

L'output è simile al seguente:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2026-02-07T00:00:00Z",
          "endTime": "2026-02-10T00:00:00Z",
          "otherLocations": {
            "zones/us-central1-b": {
              "status": "RECOMMENDED",
              "details": "Recommendation in this zone is possible."
            },
            "zones/us-central1-c": {
              "status": "NO_CAPACITY",
              "details": "Temporarily no free capacity in this zone in the
                          requested time window."
            },
            "zones/us-central1-f": {
              "status": "NOT_SUPPORTED",
              "details": "This machine family is not supported in this zone."
            }
          },
          "location": "zones/us-central1-a"
        }
      }
    }
  ]
}

Crea una richiesta per VM GPU, VM H4D o TPU

Quando crei una richiesta di prenotazione futura in modalità calendario, puoi specificare un periodo di prenotazione solo come segue:

Ora di inizio: in base alle risorse che vuoi prenotare, devi specificare un'ora di inizio che sia almeno uno dei seguenti valori dal momento in cui crei e invii una richiesta:
- Per le VM GPU e H4D, 87 ore (3 giorni e 15 ore)
- Per le TPU, 6 ore
Durata: puoi prenotare risorse per un minimo di 24 ore e un massimo di 90 giorni.

Per creare una richiesta utilizzando una VM GPU o H4D esistente come riferimento, utilizza la consoleGoogle Cloud . In caso contrario, seleziona una delle seguenti opzioni:

Console

Nella console Google Cloud , vai alla pagina Prenotazioni.

Vai a Prenotazioni
Fai clic sulla scheda Prenotazioni future.
Fai clic su Crea prenotazione futura. Viene visualizzata la pagina Crea una prenotazione futura e viene selezionato il riquadro Configurazione hardware.
Nella sezione Configurazioni, specifica le proprietà delle VM GPU, delle VM H4D o delle TPU che vuoi prenotare eseguendo una delle seguenti operazioni:
- Per specificare direttamente le proprietà della VM GPU, della VM H4D o della TPU, completa i seguenti passaggi:
  1. Seleziona Specifica il tipo di macchina.
  2. Fai clic sulla scheda GPU, TPU o Ottimizzata per il calcolo e poi seleziona un tipo di macchina GPU, un tipo di macchina H4D o una versione TPU supportati.
- Per specificare le proprietà della GPU o della VM H4D utilizzando una VM esistente come riferimento, seleziona Usa VM esistente e poi seleziona la VM.
Se hai specificato una TPU v5e (CT5LP) nel passaggio precedente, nell'elenco Tipo di workload TPU v5, seleziona una delle seguenti opzioni:
- Per eseguire carichi di lavoro sulle TPU che gestiscono grandi quantità di dati in una o più operazioni, ad esempio carichi di lavoro di addestramento ML, seleziona Batch.
- Per eseguire carichi di lavoro sulle TPU che gestiscono richieste simultanee e richiedono una latenza di rete minima, ad esempio carichi di lavoro di inferenza ML, seleziona Serving.
  
  Nota: se selezioni Serving, puoi prenotare solo 1, 4 o 8 chip TPU v5e.
Nella sezione Cerca capacità, completa i seguenti passaggi:
1. Negli elenchi Regione e Zona, seleziona la regione e la zona in cui vuoi prenotare le risorse.
2. Nel campo Capacità totale necessaria (quando prenoti VM GPU o H4D) o nell'elenco Numero di chip (quando prenoti TPU), specifica il numero di VM GPU, VM H4D o chip TPU da prenotare. Puoi specificare i seguenti valori:
  - Per le VM GPU, un valore compreso tra 1 e 80
  - Per le VM H4D, un valore compreso tra 1 e 256
  - Per i chip TPU, un valore di 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024
3. Nell'elenco Ora di inizio, seleziona l'ora di inizio della richiesta.
4. (Facoltativo) Nell'elenco Scegli la flessibilità della data di inizio, seleziona il livello di precisione della data di inizio.
5. Nel campo Durata della prenotazione, specifica per quanto tempo vuoi prenotare le risorse.
6. Fai clic su Cerca capacità. Quindi, nella tabella Capacità disponibile, seleziona una delle opzioni disponibili che contengono il tipo, il numero e il periodo di prenotazione delle VM GPU, delle VM H4D o delle TPU da prenotare.
Fai clic su Avanti.
Nella sezione Tipo di condivisione, seleziona i progetti con cui condividere la capacità richiesta:
- Per utilizzare la capacità riservata solo all'interno del tuo progetto, seleziona Locale.
- Per condividere la capacità prenotata con altri progetti, seleziona Condivisa, fai clic su Aggiungi progetti e segui le istruzioni per selezionare i progetti.
Importante: puoi specificare il tipo di condivisione e i progetti condivisi solo quando crei una richiesta. Non puoi modificare queste impostazioni dopo l'invio.
Fai clic su Avanti.
Nel campo Nome prenotazione futura, inserisci un nome per la richiesta.
Nel campo Nome prenotazione, inserisci il nome della prenotazione che Compute Engine crea automaticamente per eseguire il provisioning della capacità richiesta.
Fai clic su Crea.

gcloud

Per creare una richiesta di prenotazione futura in modalità calendario e inviarla per la revisione, utilizza il comando gcloud compute future-reservations create. In base alle risorse che vuoi prenotare, includi i seguenti flag:

Per prenotare VM GPU o H4D, includi i flag --total-count, --machine-type e --deployment-type=DENSE:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --total-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Per prenotare TPU, includi i flag --chip-count e --tpu-version:

gcloud compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Sostituisci quanto segue:

FUTURE_RESERVATION_NAME: il nome della richiesta.
NUMBER_OF_VMS: il numero di VM GPU o H4D da prenotare:
- Per le VM con GPU, il valore deve essere compreso tra 1 e 80.
- Per le VM H4D, il valore deve essere compreso tra 1 e 256.
Specifica un numero di VM uguale o inferiore al numero di VM che hai confermato come disponibili.
MACHINE_TYPE: il tipo di macchina GPU o H4D da prenotare.
NUMBER_OF_CHIPS: il numero di chip TPU da prenotare. Specifica un valore uguale o inferiore al numero di chip che hai confermato come disponibili. Il valore deve essere uno tra 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: la versione TPU da prenotare. Se specifichi una TPU v5e (V5E), devi includere il flag --workload-type per specificare il tipo di workload da eseguire sulle TPU.
RESERVATION_NAME: il nome della prenotazione che Compute Engine crea automaticamente per eseguire il provisioning della capacità richiesta.
SHARE_TYPE: indica se altri progetti della tua organizzazione possono utilizzare la capacità riservata. Specifica uno dei seguenti valori:
- Per utilizzare la capacità solo all'interno del tuo progetto: local
- Per condividere la capacità con altri progetti: projects
Se specifichi projects, devi includere il flag --share-with impostato su un elenco separato da virgole di ID progetto, ad esempio project-1,project-2. Puoi specificare fino a 100 progetti all'interno della tua organizzazione. Non includere l'ID progetto in questo elenco. Puoi utilizzare la capacità riservata per impostazione predefinita.

Importante: puoi specificare il tipo di condivisione e i progetti condivisi solo quando crei una richiesta. Non puoi modificare queste impostazioni dopo l'invio.
START_TIME: la data/ora di inizio della richiesta, che devi formattare come timestamp RFC 3339.
END_TIME: la data/ora di fine del periodo di prenotazione, che devi formattare come timestamp RFC 3339. Se vuoi specificare una durata in secondi per il periodo di prenotazione anziché un'ora di fine, sostituisci il flag --end-time con il flag --duration.
ZONE: la zona in cui vuoi prenotare le risorse.

REST

Per creare una richiesta di prenotazione futura in modalità calendario e inviarla per la revisione, invia una richiesta POST al metodo futureReservations.insert. A seconda delle risorse che vuoi prenotare, includi i seguenti campi nel corpo della richiesta:

Per prenotare VM GPU o H4D, includi i campi totalCount e machineType, nonché il campo deploymentType impostato su DENSE:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "specificSkuProperties": {
    "totalCount": NUMBER_OF_VMS,
    "instanceProperties": {
      "machineType": "MACHINE_TYPE"
    }
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Per prenotare TPU, includi i campi acceleratorCount e vmFamily:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "aggregateReservation": {
    "reservedResources": [
      {
        "accelerator": {
          "acceleratorCount": NUMBER_OF_CHIPS
        }
      }
    ],
    "vmFamily": "TPU_VERSION"
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Sostituisci quanto segue:

PROJECT_ID: l'ID del progetto in cui vuoi creare la richiesta.
ZONE: la zona in cui vuoi prenotare le risorse.
FUTURE_RESERVATION_NAME: il nome della richiesta.
RESERVATION_NAME: il nome della prenotazione che Compute Engine crea automaticamente per eseguire il provisioning della capacità richiesta.
SHARE_TYPE: indica se altri progetti della tua organizzazione possono utilizzare la capacità riservata. Specifica uno dei seguenti valori:
- Per utilizzare la capacità solo all'interno del tuo progetto: LOCAL
- Per condividere la capacità con altri progetti: SPECIFIC_PROJECTS
Se specifichi SPECIFIC_PROJECTS, nel campo shareSettings devi includere il campo projectMap per specificare i progetti con cui condividere la capacità. Puoi specificare fino a 100 progetti all'interno della tua organizzazione. Non specificare l'ID progetto. Per impostazione predefinita, puoi utilizzare la capacità riservata.

Importante: puoi specificare il tipo di condivisione e i progetti condivisi solo quando crei una richiesta. Non puoi modificare queste impostazioni dopo l'invio.

Ad esempio, per condividere la capacità richiesta con altri due progetti, includi quanto segue:
```
"shareSettings": {
  "shareType": "SPECIFIC_PROJECTS",
  "projectMap": {
    "CONSUMER_PROJECT_ID_1": {
      "projectId": "CONSUMER_PROJECT_ID_1"
    },
    "CONSUMER_PROJECT_ID_2": {
      "projectId": "CONSUMER_PROJECT_ID_2"
    }
  }
}
```
Sostituisci CONSUMER_PROJECT_ID_1 e CONSUMER_PROJECT_ID_2 con gli ID di due progetti a cui vuoi consentire di utilizzare la capacità richiesta.
NUMBER_OF_VMS: il numero di VM GPU o H4D da prenotare:
- Per le VM con GPU, il valore deve essere compreso tra 1 e 80.
- Per le VM H4D, il valore deve essere compreso tra 1 e 256.
Specifica un numero di VM uguale o inferiore al numero di VM che hai confermato come disponibili.
MACHINE_TYPE: il tipo di macchina GPU o H4D da prenotare.
NUMBER_OF_CHIPS: il numero di chip TPU da prenotare. Specifica un valore uguale o inferiore al numero di chip che hai confermato come disponibili. Il valore deve essere uno tra 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024.
TPU_VERSION: la versione TPU da prenotare. Se specifichi una TPU v5e (VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP), nel campo aggregateResources devi includere il campo workloadType per specificare il tipo di carichi di lavoro da eseguire sulle TPU.
START_TIME: la data/ora di inizio della richiesta, che devi formattare come timestamp RFC 3339.
END_TIME: la data/ora di fine del periodo di prenotazione, che devi formattare come timestamp RFC 3339. Se vuoi specificare una durata in secondi per il periodo di prenotazione anziché una data e ora di fine, sostituisci il campo endTime con il campo duration.

Passaggi successivi

Per le VM GPU o H4D, utilizza una prenotazione creata automaticamente in Compute Engine:
Utilizza una prenotazione creata automaticamente per VM GPU o TPU in Vertex AI:
- Utilizzare le prenotazioni con i job di inferenza online
- Utilizzare le prenotazioni con i job di addestramento
Utilizzare una prenotazione creata automaticamente per le TPU in Cloud TPU
Visualizzare le prenotazioni o le richieste di prenotazione futura

Creare una richiesta di prenotazione futura in modalità calendario Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Prima di iniziare

Console

gcloud

REST

Ruoli obbligatori

Autorizzazioni obbligatorie

Creare una richiesta di prenotazione futura in modalità calendario

Visualizzare la disponibilità futura delle risorse

Console

gcloud

REST

Crea una richiesta per VM GPU, VM H4D o TPU

Console

gcloud

REST

Passaggi successivi

Creare una richiesta di prenotazione futura in modalità calendario