Richiedere capacità TPU in modalità Tutta la capacità
Contatta il team dedicato al tuo account Google Cloud per richiedere una prenotazione in modalità All Capacity.
Richiedere capacità TPU in modalità Tutta la capacità con condivisione facoltativa del progetto
Contatta il team dedicato al tuo account fornendo le informazioni di registrazione richieste. Il team dell'account creerà una prenotazione futura in stato bozza che potrai esaminare tramite la console Google Cloud .
Puoi richiedere una prenotazione che può essere condivisa con altri Google Cloud progetti della tua organizzazione. Puoi anche richiedere una prenotazione che può essere condivisa con un altro servizio come Vertex AI. Google Cloud Indica la tua preferenza di condivisione delle prenotazioni nell'ambito delle informazioni di onboarding che fornisci al tuo team dell'account:
| Proprietà | Descrizione |
|---|---|
| Numero progetto | Il numero (non l'ID) del progetto in cui il team dedicato al tuo account crea la richiesta e Compute Engine esegue il provisioning della capacità. |
| Generazione TPU | Trillium o Ironwood |
| Zona | La zona in cui vuoi prenotare la capacità. |
| Numero di chip | Il numero totale di chip TPU da prenotare. |
| Ora di inizio | L'ora di inizio del periodo di prenotazione |
| Ora di fine | L'ora di fine del periodo di prenotazione |
| Nome prenotazione | Il nome della prenotazione creata da Compute Engine per fornire la capacità riservata |
| Eliminazione automatica delle prenotazioni | Se vuoi che Compute Engine elimini automaticamente la prenotazione creata automaticamente al termine del periodo di prenotazione. Se vuoi eliminare manualmente la prenotazione, devi contattare il team dell'account. |
| Tipo di condivisione | Se solo il tuo progetto può utilizzare la prenotazione creata automaticamente (LOCAL)
o se altri progetti possono utilizzare la prenotazione (SPECIFIC_PROJECTS). Non puoi
modificare questa impostazione dopo aver inviato la richiesta. Per condividere la capacità
riservata con altri progetti della tua organizzazione, procedi nel seguente modo:
|
| Nome impegno | Se il periodo di prenotazione è di un anno o più, devi acquistare e collegare un impegno basato sulle risorse alle risorse prenotate. Puoi acquistare un impegno con un piano di 1 anno o 3 anni. Se condividi la capacità riservata con altri progetti, questi progetti ricevono sconti solo se utilizzano lo stesso account di fatturazione Cloud del progetto in cui prenoti la capacità. Per informazioni dettagliate, vedi Attiva la condivisione del CUD per gli impegni basati sulle risorse. |
Le seguenti proprietà sono preimpostate per la prenotazione in modalità Tutta la capacità:
| Proprietà | Descrizione |
|---|---|
| Tipo di pianificazione della manutenzione | In che modo Compute Engine pianifica la manutenzione dell'host per le VM nel tuo
cluster. TPU Cluster Director supporta solo l'opzione GROUPED, il che
significa che la manutenzione è sincronizzata su tutte le VM TPU in un sottoblocco della
tua prenotazione. |
| Modalità operativa di prenotazione | In che modo Google Cloud gestisce il processo di recupero della VM dopo un errore dell'host o una segnalazione di host difettoso. TPU Cluster Director supporta solo l'opzione `ALL_CAPACITY`, il che significa che devi gestire autonomamente la manutenzione e il ripristino di una VM. Tuttavia, hai accesso completo a tutte le macchine nella tua prenotazione, nonché un controllo più granulare sulla topologia e sulla manutenzione delle VM. |
| Tipo di deployment | Tipo di deployment della capacità. TPU Cluster Director supporta solo `DENSE`. |
Conferma la bozza di prenotazione della capacità
Devi confermare la bozza di prenotazione creata per te dal tuo team dell'account per ricevere la capacità di TPU Cluster Director nel tuo progetto. Google Cloud Segui le istruzioni riportate in Esaminare e inviare una bozza di richiesta di prenotazione per confermare la prenotazione.
Controllare lo stato di una richiesta di capacità
Puoi determinare lo stato della tua richiesta di capacità di TPU Cluster Director. Se la richiesta viene approvata, la capacità viene allocata all'ora di inizio richiesta per la durata richiesta. La fatturazione inizia all'ora di inizio della prenotazione.
Per ulteriori dettagli, vedi Visualizzare le prenotazioni future.
Per visualizzare i dettagli di una richiesta di prenotazione futura, esegui il seguente comando utilizzando Google Cloud CLI:
gcloud compute future-reservations describe RESERVATION_NAME \ --zone=ZONE
Sostituisci quanto segue:
- RESERVATION_NAME: il nome della richiesta di prenotazione.
- ZONE: la zona in cui Google ha creato la richiesta.
L'output è simile al seguente:
creationTimestamp: '2025-04-01' kind: compute#FutureReservation name: 'RESERVATION_NAME' aggregateReservations: vmFamily:VM_FAMILY_CLOUD_TPU_LITE_DEVICE_CT6L status: lockTime: 2024-03-01T17:00:00Z procurementStatus: APPROVED timeWindow: endTime: 2025-06-01T17:00:00Z startTime: 2024-05-01T17:00:00Z ...
Espandere una richiesta di capacità esistente
Puoi ricevere capacità aggiuntiva tramite una prenotazione esistente. Quando viene aggiunta capacità aggiuntiva, questa eredita tutte le proprietà della prenotazione, ad esempio le norme di condivisione delle prenotazioni. Puoi richiedere un CUD con la capacità aggiuntiva. Il nuovo CUD punterà alla stessa prenotazione. Il tuo team dell'account completerà la procedura di espansione della prenotazione per te.
Visualizzare i dettagli della prenotazione dalla console Google Cloud
Una volta completata la prenotazione futura, puoi trovarla nella Google Cloud console
pagina Prenotazione
e visualizzarne i dettagli. Una prenotazione TPU con un tipo di deployment Dense indica che
si tratta di una prenotazione TPU Cluster Director.