Questo documento fornisce una panoramica delle zone AI per Cloud Storage. Le zone AI sono zone Google Cloud specializzate progettate per offrire capacità di calcolo per i workload di intelligenza artificiale (AI) e machine learning (ML). Offrono una capacità significativa di acceleratori ML (GPU e TPU).
Le zone AI sono ottimizzate per i workload AI e ML, ad esempio:
- Addestramento su larga scala
- Addestramento su piccola scala, ottimizzazione, inferenza collettiva e riaddestramento
- Inferenza ML in tempo reale
Per informazioni di base sulle zone AI, consulta Zone AI nella documentazione di Compute Engine.
All'interno di una regione, le zone AI potrebbero trovarsi geograficamente lontano dalle zone standard (non AI).
Le zone AI sono compatibili con altre funzionalità di Cloud Storage e Google Cloud
Suggerimenti per l'architettura di archiviazione
Ti consigliamo di utilizzare un'architettura di archiviazione a livelli per bilanciare costi, durata e prestazioni:
Livello di archiviazione a freddo: utilizza i bucket Cloud Storage regionali nelle zone standard per l'archiviazione persistente e altamente duratura (la "fonte di verità") dei set di dati di addestramento e dei checkpoint del modello.
Livello di prestazioni: utilizza servizi di archiviazione zonale specializzati per fungere da cache ad alta velocità o spazio temporaneo. Questo approccio elimina la latenza tra le zone e massimizza la velocità effettiva durante i job attivi.
Per ottimizzare le prestazioni del sistema AI e ML con le zone AI, si consigliano le seguenti soluzioni di archiviazione:
| Servizio di archiviazione | Descrizione | Casi d'uso |
|---|---|---|
| Funzionalità Anywhere Cache di Cloud Storage |
Una cache di lettura zonale completamente gestita e basata su SSD che porta i dati letti di frequente da un bucket nella zona AI. Crea un'istanza di Anywhere Cache in una zona AI per il bucket di origine regionale che contiene i set di dati di addestramento o i modelli che vuoi pubblicare. Quando il job di addestramento legge un file, questo viene inserito nella cache veloce all'interno della zona. Le letture successive vengono pubblicate direttamente dalla cache, bypassando la rete regionale. È ideale per i pattern di accesso ai dati ripetitivi nell'addestramento dei modelli e per la pubblicazione di modelli a bassa latenza. |
Suggerito per:
Non consigliato per:
|
Best practice
Segui queste best practice per l'archiviazione quando utilizzi le zone AI:
Esegui il provisioning del livello di rendimento nella stessa zona AI delle risorse di calcolo. La collocazione di calcolo e spazio di archiviazione consente di garantire che GPU e TPU rimangano completamente sature, massimizzando il "goodput" (throughput utile).
Per Anywhere Cache, prima di iniziare l'epoca di addestramento principale, esegui una prelettura del set di dati per popolare o preriscaldare la cache basata su SSD.
Zone AI disponibili
La seguente tabella mostra le zone AI e le relative regioni Google Cloud principali.
| Area geografica | Regione principale | Zona AI |
|---|---|---|
| Stati Uniti | us-south1 |
us-south1-ai1b |
Considerazioni
Puoi accedere ai prodotti Google Cloud in una regione Google Cloud dalla zona AI della regione. Tuttavia, l'accesso ai servizi in una regione Google Cloudda una zona AI può aggiungere latenza di rete, perché la posizione della zona AI potrebbe essere fisicamente separata dalle posizioni delle zone standard della regione.
Ti consigliamo di eseguire i workload non ML nelle zone standard, non nelle zone AI, perché queste ultime non offrono tutti i servizi localmente. Google Cloud
Passaggi successivi
- Crea un bucket.
- Scopri di più su Anywhere Cache.
- Scopri di più sulle località dei bucket Cloud Storage.
- Leggi le indicazioni di progettazione del Centro architettura per i carichi di lavoro AI e ML.