Cloud Storage offre una serie di opzioni per aiutarti a ottimizzare l'archiviazione dei dati per i casi d'uso che richiedono prestazioni elevate, come l'intelligenza artificiale (AI), il machine learning (ML) e l'analisi con uso intensivo di dati. Questa pagina presenta queste opzioni e ti guida nella selezione di un'opzione adatta alle esigenze dei tuoi workload.
La famiglia di prodotti Cloud Storage Rapid
Cloud Storage Rapid è una famiglia di prodotti ad alte prestazioni in Cloud Storage progettati per eliminare i colli di bottiglia dei dati per i carichi di lavoro di AI/ML e analisi dei dati. Man mano che i modelli di AI/ML diventano più complessi e i set di dati raggiungono scale di petabyte, le prestazioni di archiviazione diventano spesso il collo di bottiglia principale per i costosi cluster di GPU e TPU. Cloud Storage Rapid sfrutta le architetture zonali per avvicinare i dati alle risorse di computing, contribuendo a mantenere saturi gli acceleratori, ridurre i tempi di addestramento e abbassare il costo totale di proprietà (TCO) per i carichi di lavoro più esigenti. Cloud Storage Rapid include Rapid Bucket e Anywhere Cache.
Archivia i dati nella classe di archiviazione Rapid Storage utilizzando Rapid Bucket
Rapid Bucket è una soluzione di archiviazione di oggetti zonale ad alte prestazioni che ti consente di archiviare i dati nella classe di archiviazione Rapid definendo una zona come posizione di un bucket. Rapid Bucket ti consente di collocare i dati nella stessa zona fisica degli acceleratori AI e ottenere la latenza più bassa e il throughput più elevato tra le altre offerte di prodotti Cloud Storage. Rapid Bucket offre una latenza inferiore al millisecondo, un throughput aggregato fino a 15 TB/s e supporta fino a 20 milioni di query al secondo (QPS).
Rapid Bucket supporta le aggiunte di oggetti stateful e in streaming, consentendo alle applicazioni di scrivere dati negli oggetti esistenti in tempo reale. Questa funzionalità ti consente di evitare costose riscritture di oggetti e di ottenere una visibilità immediata dei dati, consentendo alle applicazioni consumer di leggere i dati man mano che vengono scritti.
Ideale per: addestramento, checkpointing e gestione di modelli AI che richiedono latenza bassissima e prestazioni deterministiche elevate
Utilizza questa opzione se vuoi prestazioni elevate dedicate sia per le letture sia per le scritture.
Per scoprire come creare bucket zonali con Rapid Bucket, consulta Crea bucket zonali.
Crea cache zonali con Anywhere Cache
Anywhere Cache è una cache di lettura zonale completamente gestita e basata su SSD che funziona con i bucket regionali, a due regioni o multiregionali esistenti senza richiedere modifiche all'API. Una cache offre capacità di archiviazione temporanea e larghezza di banda che aumentano o diminuiscono automaticamente in base alle esigenze dei tuoi carichi di lavoro. I dati vengono inseriti automaticamente nella cache dal bucket quando vengono letti da una VM che si trova nella stessa zona della cache.
Anywhere Cache fornisce un throughput aggregato di 2,5 TB/s e riduce la latenza per letture più veloci, posizionando i dati nelle stesse zone delle VM. Oltre a pubblicare i dati più rapidamente, i dati pubblicati da una cache possono comportare costi operativi, di recupero e di trasferimento dei dati inferiori rispetto a quelli pubblicati direttamente da un bucket. Per saperne di più, consulta Vantaggi per Anywhere Cache.
Ideale per: addestramento, ripristino dei checkpoint ed erogazione di modelli di AI che richiedono una larghezza di banda di lettura elevata da un bucket Cloud Storage esistente
Utilizza questa opzione se: disponi di un'archiviazione dei dati esistente in un bucket Cloud Storage che vuoi accelerare
Per scoprire come utilizzare Anywhere Cache, consulta Creare e gestire cache.