Cloud Storage offre una serie di opzioni per aiutarti a ottimizzare l'archiviazione dei dati per i casi d'uso che richiedono prestazioni elevate, come l'intelligenza artificiale (AI), il machine learning (ML) e l'analisi dei dati con uso intensivo di dati. Questa pagina presenta queste opzioni e ti guida nella selezione di un'opzione adatta alle esigenze dei tuoi carichi di lavoro.
La famiglia di prodotti Cloud Storage Rapid
Cloud Storage Rapid è una famiglia di prodotti ad alte prestazioni in Cloud Storage progettati per eliminare i colli di bottiglia dei dati per i carichi di lavoro di AI/ML e analisi dei dati. Man mano che i modelli di AI/ML diventano più complessi e i set di dati raggiungono scale di petabyte, le prestazioni di archiviazione diventano spesso il collo di bottiglia principale per i costosi cluster GPU e TPU. Cloud Storage Rapid sfrutta le architetture zonali per avvicinare i dati alle risorse di computing, aiutando gli acceleratori a rimanere saturi, riducendo i tempi di addestramento e il costo totale di proprietà (TCO) per i carichi di lavoro più impegnativi.
Cloud Storage Rapid include Rapid Bucket e Rapid Cache.
Archivia i dati nella classe di archiviazione Rapid Storage utilizzando Rapid Bucket
Rapid Bucket è una soluzione di archiviazione di oggetti zonale ad alte prestazioni che ti consente di archiviare i dati nella classe di archiviazione Rapid definendo una zona come località di un bucket. Rapid Bucket ti consente di collocare i dati nella stessa zona fisica degli acceleratori AI e ti aiuta a ottenere la latenza più bassa e il throughput più elevato tra le altre offerte di prodotti Cloud Storage. Rapid Bucket offre una latenza inferiore al millisecondo, un throughput aggregato fino a 15 TB/s e supporta fino a 20 milioni di query al secondo (QPS).
Rapid Bucket supporta le aggiunte di oggetti con stato e in streaming, consentendo alle applicazioni di scrivere dati negli oggetti esistenti in tempo reale. Questa funzionalità ti consente di evitare costose riscritture di oggetti e di ottenere una visibilità immediata dei dati, consentendo alle applicazioni consumer di leggere i dati durante la scrittura.
Ideale per: addestramento, checkpointing e gestione di modelli AI che richiedono una latenza bassissima e prestazioni deterministiche elevate
Utilizza questa opzione se: vuoi prestazioni elevate dedicate sia per le letture che per le scritture
Per scoprire come creare bucket zonali con Rapid Bucket, consulta Crea bucket zonali.
Crea cache zonali con Rapid Cache
Rapid Cache è una cache di lettura zonale completamente gestita e basata su SSD che funziona con i bucket regionali, a due regioni o multi-regionali esistenti senza richiedere modifiche all'API. Una cache offre capacità di archiviazione e larghezza di banda che fanno lo scale up o lo scale down automaticamente in base alle esigenze dei carichi di lavoro. I dati vengono inseriti automaticamente nella cache dal bucket quando vengono letti da una VM che si trova nella stessa zona della cache.
Rapid Cache fornisce un throughput aggregato di 2,5 TB/s e riduce la latenza per letture più rapide collocando i dati nelle stesse zone delle VM. Oltre a gestire i dati più velocemente, i dati gestiti da una cache possono comportare costi di trasferimento dei dati, costi di recupero dei dati e costi operativi inferiori rispetto ai dati gestiti direttamente da un bucket. Per ulteriori informazioni, consulta Vantaggi di Rapid Cache.
Ideale per: addestramento, ripristino del checkpointing e gestione di modelli AI che richiedono una larghezza di banda di lettura elevata da un bucket Cloud Storage esistente
Utilizza questa opzione se: hai già archiviato i dati in un bucket Cloud Storage che vuoi accelerare
Per scoprire come utilizzare Rapid Cache, consulta Creare e gestire le cache.