Scegliere tra l'archiviazione SSD e HDD

Quando crei un'istanza Bigtable, scegli se i relativi cluster memorizzano i dati su unità a stato solido (SSD) o unità disco rigido (HDD):

  • Archiviazione SSD: è la scelta più efficiente ed economica per la maggior parte dei casi d'uso.
  • Spazio di archiviazione HDD: a volte è appropriato per set di dati di grandi dimensioni che non sono sensibili alla latenza o a cui si accede di rado.

Le istanze Bigtable che utilizzano l'archiviazione SSD supportano l'archiviazione a livelli (anteprima). Puoi attivare un livello di archiviazione ad accesso sporadico a livello di tabella nei cluster SSD in cui puoi archiviare i dati a cui si accede raramente nel modo più conveniente. Per saperne di più, consulta la panoramica dell'archiviazione a livelli.

Indipendentemente dal tipo di archiviazione scelto, i tuoi dati vengono archiviati in un file system distribuito e replicato che si estende su molte unità fisiche.

Confronto dei livelli di archiviazione

Le seguenti tabelle confrontano i livelli di archiviazione Bigtable, a seconda della versione dell'istanza.

Versione Enterprise

Livello di archiviazione Capacità del nodo Latenza prevista Operazioni Ideale per
Istanza SSD SSD da 5 TB Scrittura/lettura: ms a una sola cifra Scrittura, lettura, aggiornamento, eliminazione Workload con throughput di scrittura/lettura elevato e bassa latenza
Istanza SSD, archiviazione a livelli abilitata 32 TB (fino a 5 TB SSD) Scrittura/lettura SSD: millisecondi a una sola cifra Scrittura, lettura, aggiornamento, eliminazione Set di dati di grandi dimensioni con dati ad accesso non frequente
Accesso sporadico: bassa latenza a due cifre in millisecondi Sola lettura
Istanza HDD 16 TB Scrittura: millisecondi a singola cifra
Lettura: millisecondi a doppia cifra bassi
Scrittura, lettura, aggiornamento, eliminazione Set di dati di grandi dimensioni con workload non sensibili alla latenza

Versione Enterprise Plus

Livello di archiviazione Capacità del nodo Latenza prevista Operazioni Ideale per
Istanza SSD SSD da 5 TB Scrittura/lettura: ms a una sola cifra Scrittura, lettura, aggiornamento, eliminazione Workload con throughput di scrittura/lettura elevato e bassa latenza
Istanza SSD, archiviazione a livelli abilitata 64 TB (fino a 5 TB SSD) Scrittura/lettura SSD: millisecondi a una sola cifra Scrittura, lettura, aggiornamento, eliminazione Set di dati di grandi dimensioni con dati ad accesso non frequente
Accesso sporadico: bassa latenza a due cifre in millisecondi Sola lettura
Istanza HDD 16 TB Scrittura: millisecondi a singola cifra
Lettura: millisecondi a doppia cifra bassi
Scrittura, lettura, aggiornamento, eliminazione Set di dati di grandi dimensioni con workload non sensibili alla latenza

Per saperne di più sul rendimento dei tipi di archiviazione Bigtable, consulta Informazioni sul rendimento. Per saperne di più sulle versioni, consulta la Panoramica delle versioni.

In caso di dubbio, scegli l'archiviazione SSD

Esistono diversi motivi per cui in genere è meglio utilizzare l'archiviazione SSD per il cluster Bigtable:

  • L'SSD è molto più veloce e offre prestazioni più prevedibili rispetto all'HDD. In un cluster Bigtable, l'archiviazione SSD offre latenze significativamente inferiori sia per le letture che per le scritture rispetto all'archiviazione HDD.
  • La velocità effettiva dell'HDD è molto più limitata rispetto a quella dell'SSD. In un cluster che utilizza l'archiviazione HDD, è possibile raggiungere il throughput massimo prima che l'utilizzo della CPU raggiunga il 100%, una situazione che puoi monitorare utilizzando la metrica Carico del disco. Per aumentare la velocità effettiva, devi aggiungere altri nodi, ma il costo dei nodi aggiuntivi potrebbe superare i risparmi derivanti dall'utilizzo dello spazio di archiviazione HDD. L'archiviazione SSD non presenta questa limitazione, perché offre una velocità effettiva molto maggiore per nodo. In genere, un cluster che utilizza l'archiviazione SSD raggiunge la velocità effettiva massima solo quando utilizza tutta la CPU e la memoria disponibili.
  • Le letture delle singole righe sull'HDD sono molto lente. A causa del tempo di ricerca del disco, lo spazio di archiviazione HDD supporta solo il 5% delle righe lette al secondo dello spazio di archiviazione SSD. Le scansioni multiriga di grandi dimensioni, tuttavia, non sono interessate in modo così negativo.
  • L'archiviazione SSD supporta un'opzione di archiviazione a livelli per i dati ad accesso non frequente.
  • Il livello in memoria (anteprima) è disponibile solo per le istanze che utilizzano l'archiviazione SSD. La funzionalità in memoria richiede la versione Enterprise Plus.

Un potenziale svantaggio dell'archiviazione SSD è che richiede più nodi nei tuoi cluster in base alla quantità di dati archiviati. In pratica, però, potresti aver bisogno di questi nodi aggiuntivi in modo che i cluster possano stare al passo con il traffico in entrata, non solo per supportare la quantità di dati che stai archiviando.

Casi d'uso per l'archiviazione HDD

L'archiviazione HDD è adatta ai casi d'uso che soddisfano tutti i seguenti criteri:

  • I tuoi carichi di lavoro sono incentrati sulla scrittura e basati sui dati.
  • I tuoi carichi di lavoro non sono sensibili alla latenza.
  • I tuoi dati non supportano un'applicazione rivolta agli utenti.
  • I carichi di lavoro batch sono costituiti principalmente da scansioni e scritture con letture casuali occasionali di un numero ridotto di righe o letture puntuali.
  • Non prevedi di utilizzare il raddoppio della scalabilità dei nodi�.
  • Nella versione Enterprise Plus, prevedi di utilizzare Data Boost per HDD.

Ad esempio, se prevedi di archiviare dati storici estesi per un numero elevato di dispositivi di telerilevamento e poi utilizzare i dati per generare report giornalieri, il risparmio sui costi per l'archiviazione HDD potrebbe giustificare il compromesso sulle prestazioni. D'altra parte, se prevedi di utilizzare i dati per visualizzare una dashboard in tempo reale, probabilmente non avrebbe senso utilizzare l'archiviazione HDD: le letture sarebbero molto più frequenti in questo caso e le letture che non sono scansioni sono molto più lente con l'archiviazione HDD.

Passare dall'archiviazione SSD a quella HDD e viceversa

Quando crei un'istanza Bigtable, la scelta dell'archiviazione SSD o HDD per l'istanza è definitiva. Non puoi utilizzare la console Google Cloud per modificare il tipo di spazio di archiviazione utilizzato per l'istanza.

Se vuoi modificare il tipo di archiviazione in cui è memorizzata una tabella, utilizza la funzionalità di backup:

  1. Crea o pianifica di utilizzare un'istanza che utilizza il tipo di archiviazione che preferisci.
  2. Crea un backup della tabella.
  3. Esegui il ripristino dal backup in una nuova tabella nell'altra istanza.

Passaggi successivi