Scegliere tra l'archiviazione SSD e HDD
Quando crei un'istanza Bigtable, scegli se i relativi cluster memorizzano i dati su unità a stato solido (SSD) o unità disco rigido (HDD):
- Lo spazio di archiviazione SSD è la scelta più efficiente ed economica per la maggior parte dei casi d'uso.
- L'archiviazione HDD è talvolta appropriata per set di dati di grandi dimensioni che non sono sensibili alla latenza o a cui si accede raramente.
Le istanze Bigtable che utilizzano l'archiviazione SSD supportano l'archiviazione a livelli (anteprima). Puoi attivare un livello di archiviazione accesso infrequente a livello di tabella sui cluster SSD in cui puoi archiviare dati a cui si accede raramente nel modo più conveniente. Per ulteriori informazioni, consulta la panoramica dell'archiviazione a livelli.
Indipendentemente dal tipo di archiviazione scelto, i tuoi dati vengono archiviati in un file system distribuito e replicato che si estende su molte unità fisiche.
La tabella seguente confronta i tipi di archiviazione Bigtable nel contesto dell'archiviazione a livelli:
Istanza e livello | Capacità del nodo | Latenza prevista | Operazioni | Ideale per |
---|---|---|---|---|
Istanza SSD, livello di archiviazione SSD | 5 TB | Scrittura/lettura: ms a una sola cifra | Scrivere, leggere, aggiornare, eliminare | Workload con throughput di scrittura/lettura elevato e bassa latenza |
Istanza SSD, archiviazione a livelli abilitata | 32 TB (fino a 5 TB SSD) | Scrittura: ms a una sola cifra Lettura: millisecondi a due cifre basse |
Scrivere, leggere, aggiornare, eliminare | Set di dati di grandi dimensioni con dati ad accesso non frequente |
Istanza HDD, livello HDD | 16 TB | Scrittura: ms a una sola cifra Lettura: millisecondi a due cifre basse |
Scrivere, leggere, aggiornare, eliminare | Set di dati di grandi dimensioni con carichi di lavoro non sensibili alla latenza |
Per saperne di più sul rendimento dei tipi di archiviazione Bigtable, consulta Informazioni sul rendimento.
In caso di dubbio, scegli l'archiviazione SSD
Esistono diversi motivi per cui in genere è meglio utilizzare l'archiviazione SSD per il cluster Bigtable:
- L'SSD è molto più veloce e offre prestazioni più prevedibili rispetto all'HDD. In un cluster Bigtable, l'archiviazione SSD offre latenze significativamente inferiori sia per le letture che per le scritture rispetto all'archiviazione HDD.
- La velocità effettiva dell'HDD è molto più limitata rispetto a quella dell'SSD. In un cluster che utilizza l'archiviazione HDD, è possibile raggiungere il throughput massimo prima che l'utilizzo della CPU raggiunga il 100%, una situazione che puoi monitorare utilizzando la metrica Carico del disco. Per aumentare la velocità effettiva, devi aggiungere altri nodi, ma il costo dei nodi aggiuntivi potrebbe superare i risparmi derivanti dall'utilizzo dello spazio di archiviazione HDD. Lo spazio di archiviazione SSD non presenta questa limitazione, perché offre una velocità effettiva molto maggiore per nodo. In genere, un cluster che utilizza lo spazio di archiviazione SSD raggiunge la velocità effettiva massima solo quando utilizza tutta la CPU e la memoria disponibili.
- Le letture delle singole righe su HDD sono molto lente. A causa del tempo di ricerca del disco, lo spazio di archiviazione HDD supporta solo il 5% delle righe lette al secondo dello spazio di archiviazione SSD. Le scansioni multiriga di grandi dimensioni, tuttavia, non sono interessate in modo così negativo.
- L'archiviazione SSD supporta un'opzione di archiviazione a livelli per i dati ad accesso non frequente.
Un potenziale svantaggio dell'archiviazione SSD è che richiede più nodi nei tuoi cluster in base alla quantità di dati archiviati. In pratica, però, potresti aver bisogno di questi nodi aggiuntivi in modo che i cluster possano stare al passo con il traffico in entrata, non solo per supportare la quantità di dati che stai archiviando.
Casi d'uso per l'archiviazione HDD
Lo spazio di archiviazione HDD è adatto ai casi d'uso che soddisfano tutti i seguenti criteri:
- I tuoi carichi di lavoro sono incentrati sulla scrittura e basati sui dati.
- I tuoi carichi di lavoro non sono sensibili alla latenza.
- I tuoi dati non supportano un'applicazione rivolta agli utenti.
- I carichi di lavoro batch sono costituiti principalmente da scansioni e scritture con letture casuali occasionali di un numero ridotto di righe o letture puntuali.
- Non prevedi di utilizzare Data Boost, lo spazio di archiviazione a livelli o lo scaling dei nodi 2x.
Ad esempio, se prevedi di archiviare dati storici estesi per un numero elevato di dispositivi di telerilevamento e poi utilizzare i dati per generare report giornalieri, il risparmio sui costi per l'archiviazione HDD potrebbe giustificare il compromesso sulle prestazioni. D'altra parte, se prevedi di utilizzare i dati per visualizzare una dashboard in tempo reale, probabilmente non avrebbe senso utilizzare l'archiviazione HDD: le letture sarebbero molto più frequenti in questo caso e le letture che non sono scansioni sono molto più lente con l'archiviazione HDD.
Passare dall'archiviazione SSD a quella HDD e viceversa
Quando crei un'istanza Bigtable, la scelta dell'archiviazione SSD o HDD per l'istanza è definitiva. Non puoi utilizzare la console Google Cloud per modificare il tipo di spazio di archiviazione utilizzato per l'istanza.
Se vuoi modificare il tipo di archiviazione in cui è memorizzata una tabella, utilizza la funzionalità di backup:
- Crea o pianifica di utilizzare un'istanza che utilizza il tipo di archiviazione che preferisci.
- Crea un backup della tabella.
- Esegui il ripristino dal backup in una nuova tabella nell'altra istanza.
Passaggi successivi
- Crea un'istanza con spazio di archiviazione SSD o HDD.
- Scopri di più sull'archiviazione a livelli.