Quote di Cloud TPU

Questo documento elenca le quote che si applicano a Cloud TPU. Per informazioni sui prezzi di Cloud TPU, consulta Prezzi per Cloud TPU.

Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud , le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.

Per saperne di più, consulta la Panoramica delle quote di Cloud.

.

Quota TPU

Le quote TPU sono limiti al numero di core Cloud TPU che puoi utilizzare con un Google Cloud progetto. Ogni versione di TPU è associata alla propria quota. In oltre, ogni quota della versione di Cloud TPU è suddivisa in quota on demand e preemptible (o spot) quota.

Quando crei risorse Cloud TPU, per impostazione predefinita crei risorse on demand. Puoi creare risorse preemptible utilizzando il parametro --spot quando crei risorse con il comando gcloud. Per saperne di più, consulta Gestire le risorse TPU.

Quote Cloud TPU predefinite

Le tabelle seguenti mostrano i valori predefiniti per la quota on demand e preemptible per ogni zona disponibile. Questi valori specificano il numero massimo di core TPU che puoi utilizzare nel tuo progetto.

Quote preemptible

Versione TPU Quota predefinita (numero di core) Nome quota
v6e 1536 core Core TPU v6e preemptible per progetto e per zona
v5p 768 core Core TPU v5p preemptible per progetto e per zona
v5e 1536 core Core pod TPU v5 lite preemptible per progetto e per zona
v4 0 core Core pod TPU v4 preemptible per progetto e per zona
Pod v3 32 core Core pod TPU v3 preemptible per progetto e per zona
v3 120 core Core TPU v3 preemptible per progetto e per zona
Pod v2 32 core Core pod TPU v2 preemptible per progetto e per zona
v2 120 core Core TPU v2 preemptible per progetto e per zona

Quote on demand

Versione TPU Quota predefinita (numero di core) Nome quota
v6e 512 core Core TPU v6e per progetto e per zona
v5p 128 core Core TPU v5p per progetto e per zona
v5e 512 core Core pod TPU v5 lite per progetto e per zona
v4 0 core Core pod TPU v4 per progetto e per zona
Pod v3 32 core Core pod TPU v3 per progetto e per zona
v3 40 core Core TPU v3 per progetto e per zona
Pod v2 32 core Core pod TPU v2 per progetto e per zona
v2 40 core Core TPU v2 per progetto e per zona

Visualizzare e richiedere una quota aggiuntiva

Puoi visualizzare la quota allocata per il tuo Google Cloud progetto nella pagina Quote della Google Cloud console.

Puoi richiedere una quota Cloud TPU aggiuntiva dalla pagina Quote. Per trovare la quota che vuoi aumentare, fai clic sui tre puntini verticali e scegli Modifica quota. Per saperne di più, consulta Richiedere un aggiustamento delle quote. Se richiedi una quota inferiore alla soglia di approvazione automatica, la richiesta verrà approvata automaticamente.

Quote preemptible

Versione TPU Soglia di approvazione automatica Nome quota
v6e Tutte le zone: 0 core Core TPU v6e preemptible per progetto e per zona
v5p Tutte le zone: 0 core Core TPU v5p preemptible per progetto e per zona
v5e
  • us-east5-b: 800 core
  • us-west4-a: 1600 core
  • us-west4-b: 3968 core
  • us-west1-c: 576 core
  • us-central1-a: 3264 core
  • europe-west4-a: 4032 core
Core pod TPU v5 lite preemptible per progetto e per zona
v4 Tutte le zone: 0 core Core pod TPU v4 preemptible per progetto e per zona
Pod v3
  • europe-west4-a: 512 core
  • us-east1-d: 320 core
Core pod TPU v3 preemptible per progetto e per zona
v3
  • us-central1-a: 64 core
  • europe-west4-a: 128 core
Core TPU v3 preemptible per progetto e per zona
Pod v2
  • us-central1-a: 64 core
  • europe-west4-a: 64 core
Core pod TPU v2 preemptible per progetto e per zona
v2
  • us-central1-b: 128 core
  • us-central1-c: 64 core
  • us-central1-f: 128 core
  • europe-west4-a: 32 core
Core TPU v2 preemptible per progetto e per zona

Quote on demand

Versione TPU Soglia di approvazione automatica Nome quota
v6e Tutte le zone: 0 core Core TPU v6e per progetto e per zona
v5p us-east5-a: 64 core Core TPU v5p per progetto e per zona
v5e Tutte le zone: 64 core Core pod TPU v5 lite per progetto e per zona
v4 Tutte le zone: 0 core Core pod TPU v4 per progetto e per zona
Pod v3
  • europe-west4-a: 128 core
  • us-east1-d: 64 core
Core pod TPU v3 per progetto e per zona
v3
  • us-central1-a: 64 core
  • europe-west4-a: 128 core
Core TPU v3 per progetto e per zona
Pod v2
  • us-central1-a: 64 core
  • europe-west4-a: 64 core
Core pod TPU v2 per progetto e per zona
v2
  • us-central1-b: 128 core
  • us-central1-c: 64 core
  • us-central1-f: 128 core
  • europe-west4-a: 32 core
Core TPU v2 per progetto e per zona

Riceverai un'email che ti comunicherà se la tua richiesta di quota è stata approvata o rifiutata. Google Cloud Gli aumenti delle quote di servizio avvengono gradualmente. Ciò potrebbe comportare implementazioni continue in diverse regioni o risorse. Durante l'implementazione, il valore della quota visualizzato nella Google Cloud console o nell'API Cloud Quotas non rifletterà il nuovo valore della quota aumentata fino al completamento dell'implementazione. Per saperne di più, consulta Visualizzare le implementazioni in corso.

Passaggi successivi