Richiedere capacità TPU in modalità Tutta la capacità

Contatta il team dedicato al tuo account Google Cloud per richiedere una prenotazione in modalità All Capacity.

Richiedere capacità TPU in modalità Tutta la capacità con condivisione facoltativa del progetto

Contatta il team dedicato al tuo account fornendo le informazioni di registrazione richieste. Il team dell'account creerà una prenotazione futura in stato bozza che potrai esaminare tramite la console Google Cloud .

Puoi richiedere una prenotazione che può essere condivisa con altri Google Cloud progetti della tua organizzazione. Puoi anche richiedere una prenotazione che può essere condivisa con un altro servizio come Vertex AI. Google Cloud Indica la tua preferenza di condivisione delle prenotazioni nell'ambito delle informazioni di onboarding che fornisci al tuo team dell'account:

Proprietà Descrizione
Numero progetto Il numero (non l'ID) del progetto in cui il team dedicato al tuo account crea la richiesta e Compute Engine esegue il provisioning della capacità.
Generazione TPU Trillium o Ironwood
Zona La zona in cui vuoi prenotare la capacità.
Numero di chip Il numero totale di chip TPU da prenotare.
Ora di inizio L'ora di inizio del periodo di prenotazione
Ora di fine L'ora di fine del periodo di prenotazione
Nome prenotazione Il nome della prenotazione creata da Compute Engine per fornire la capacità riservata
Eliminazione automatica delle prenotazioni Se vuoi che Compute Engine elimini automaticamente la prenotazione creata automaticamente al termine del periodo di prenotazione. Se vuoi eliminare manualmente la prenotazione, devi contattare il team dell'account.
Tipo di condivisione Se solo il tuo progetto può utilizzare la prenotazione creata automaticamente (LOCAL) o se altri progetti possono utilizzare la prenotazione (SPECIFIC_PROJECTS). Non puoi modificare questa impostazione dopo aver inviato la richiesta. Per condividere la capacità riservata con altri progetti della tua organizzazione, procedi nel seguente modo:
  1. Se non l'hai ancora fatto, verifica che il progetto in cui Google crea la richiesta sia autorizzato a creare prenotazioni condivise.
  2. Fornisci gli ID dei progetti con cui condividere la capacità riservata. Puoi specificare fino a 100 progetti nella tua organizzazione.
Nome impegno Se il periodo di prenotazione è di un anno o più, devi acquistare e collegare un impegno basato sulle risorse alle risorse prenotate. Puoi acquistare un impegno con un piano di 1 anno o 3 anni. Se condividi la capacità riservata con altri progetti, questi progetti ricevono sconti solo se utilizzano lo stesso account di fatturazione Cloud del progetto in cui prenoti la capacità. Per informazioni dettagliate, vedi Attiva la condivisione del CUD per gli impegni basati sulle risorse.

Le seguenti proprietà sono preimpostate per la prenotazione in modalità Tutta la capacità:

Proprietà Descrizione
Tipo di pianificazione della manutenzione In che modo Compute Engine pianifica la manutenzione dell'host per le VM nel tuo cluster. TPU Cluster Director supporta solo l'opzione GROUPED, il che significa che la manutenzione è sincronizzata su tutte le VM TPU in un sottoblocco della tua prenotazione.
Modalità operativa di prenotazione In che modo Google Cloud gestisce il processo di recupero della VM dopo un errore dell'host o una segnalazione di host difettoso. TPU Cluster Director supporta solo l'opzione `ALL_CAPACITY`, il che significa che devi gestire autonomamente la manutenzione e il ripristino di una VM. Tuttavia, hai accesso completo a tutte le macchine nella tua prenotazione, nonché un controllo più granulare sulla topologia e sulla manutenzione delle VM.
Tipo di deployment Tipo di deployment della capacità. TPU Cluster Director supporta solo `DENSE`.

Conferma la bozza di prenotazione della capacità

Devi confermare la bozza di prenotazione creata per te dal tuo team dell'account per ricevere la capacità di TPU Cluster Director nel tuo progetto. Google Cloud Segui le istruzioni riportate in Esaminare e inviare una bozza di richiesta di prenotazione per confermare la prenotazione.

Controllare lo stato di una richiesta di capacità

Puoi determinare lo stato della tua richiesta di capacità di TPU Cluster Director. Se la richiesta viene approvata, la capacità viene allocata all'ora di inizio richiesta per la durata richiesta. La fatturazione inizia all'ora di inizio della prenotazione.

Per ulteriori dettagli, vedi Visualizzare le prenotazioni future.

Per visualizzare i dettagli di una richiesta di prenotazione futura, esegui il seguente comando utilizzando Google Cloud CLI:

gcloud compute future-reservations describe RESERVATION_NAME \
    --zone=ZONE

Sostituisci quanto segue:

  • RESERVATION_NAME: il nome della richiesta di prenotazione.
  • ZONE: la zona in cui Google ha creato la richiesta.

L'output è simile al seguente:

creationTimestamp: '2025-04-01'
kind: compute#FutureReservation
name: 'RESERVATION_NAME'
   aggregateReservations:
     vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L
status:
  lockTime: 2024-03-01T17:00:00Z
  procurementStatus: APPROVED
timeWindow:
  endTime: 2025-06-01T17:00:00Z
  startTime: 2024-05-01T17:00:00Z
...

Espandere una richiesta di capacità esistente

Puoi ricevere capacità aggiuntiva tramite una prenotazione esistente. Quando viene aggiunta capacità aggiuntiva, questa eredita tutte le proprietà della prenotazione, ad esempio le norme di condivisione delle prenotazioni. Puoi richiedere un CUD con la capacità aggiuntiva. Il nuovo CUD punterà alla stessa prenotazione. Il tuo team dell'account completerà la procedura di espansione della prenotazione per te.

Visualizzare i dettagli della prenotazione dalla console Google Cloud

Una volta completata la prenotazione futura, puoi trovarla nella Google Cloud console pagina Prenotazione e visualizzarne i dettagli. Una prenotazione TPU con un tipo di deployment Dense indica che si tratta di una prenotazione TPU Cluster Director.