Choisir entre le stockage SSD et HDD
Lorsque vous créez une instance Bigtable, vous devez choisir si ses clusters stockent les données sur des disques durs SSD ou HDD :
- Stockage SSD : constitue le choix le plus efficace et le plus rentable dans la plupart des cas.
- Stockage HDD : parfois approprié pour les grands ensembles de données qui ne sont pas sensibles à la latence ou qui sont rarement utilisés.
Les instances Bigtable qui utilisent le stockage SSD sont compatibles avec le stockage hiérarchisé (version Preview). Vous pouvez activer un niveau de stockage Infrequent Access au niveau de la table sur les clusters SSD, ce qui vous permet de stocker les données rarement consultées de la manière la plus économique possible. Pour en savoir plus, consultez Présentation du stockage par niveaux.
Quel que soit le type de stockage que vous choisissez, vos données sont stockées sur un système de fichiers répliqués et distribués qui englobe de nombreux disques physiques.
Comparaison des niveaux de stockage
Les tableaux suivants comparent les niveaux de stockage Bigtable en fonction de l'édition de votre instance.
Édition Enterprise
| Niveau de stockage | Capacité des nœuds | Latence attendue | Opérations | Application idéale |
|---|---|---|---|---|
| Instance SSD | SSD de 5 To | Écriture/Lecture : quelques millisecondes | Écrire, lire, mettre à jour, supprimer | Charges de travail à haut débit d'écriture/lecture et à faible latence |
| Instance SSD, stockage à plusieurs niveaux activé | 32 To (jusqu'à 5 To de SSD) | Écriture/lecture SSD : quelques millisecondes | Écrire, lire, mettre à jour, supprimer | Ensembles de données volumineux avec des données rarement consultées |
| Accès peu fréquent : quelques dizaines de millisecondes | Lecture seule | |||
| Instance HDD | 16 To | Écriture : quelques millisecondes Lecture : quelques dizaines de millisecondes |
Écrire, lire, mettre à jour, supprimer | Ensembles de données volumineux avec des charges de travail insensibles à la latence |
Édition Enterprise Plus
| Niveau de stockage | Capacité des nœuds | Latence attendue | Opérations | Application idéale |
|---|---|---|---|---|
| Instance SSD | SSD de 5 To | Écriture/Lecture : quelques millisecondes | Écrire, lire, mettre à jour, supprimer | Charges de travail à haut débit d'écriture/lecture et à faible latence |
| Instance SSD, stockage à plusieurs niveaux activé | 64 To (jusqu'à 5 To de SSD) | Écriture/lecture SSD : quelques millisecondes | Écrire, lire, mettre à jour, supprimer | Ensembles de données volumineux avec des données rarement consultées |
| Accès peu fréquent : quelques dizaines de millisecondes | Lecture seule | |||
| Instance HDD | 16 To | Écriture : quelques millisecondes Lecture : quelques dizaines de millisecondes |
Écrire, lire, mettre à jour, supprimer | Ensembles de données volumineux avec des charges de travail insensibles à la latence |
Pour en savoir plus sur les performances des types de stockage Bigtable, consultez Analyser les performances. Pour en savoir plus sur les éditions, consultez la présentation des éditions.
En cas de doute, choisir le stockage SSD
En règle générale, il est recommandé d'utiliser le stockage SSD pour votre cluster Bigtable, et ce pour plusieurs raisons :
- Les disques durs SSD sont nettement plus rapides et offrent des performances plus prévisibles que les disques durs HDD. Dans un cluster Bigtable, le stockage SSD présente des latences bien plus faibles pour les lectures et les écritures que le stockage HDD.
- Le débit du disque dur HDD est beaucoup plus limité que celui du disque dur SSD. Dans un cluster qui utilise le stockage HDD, il est possible d'atteindre le débit maximal avant que l'utilisation du processeur n'atteigne 100 %, une situation que vous pouvez surveiller à l'aide de la métrique de charge du disque. Pour augmenter le débit, vous devez ajouter d'autres nœuds. En revanche, le coût des nœuds supplémentaires est susceptible de dépasser les économies que vous avez réalisées grâce à l'utilisation du stockage HDD. Cette limite ne s'applique pas au stockage SSD, car il offre beaucoup plus de débit par nœud. En règle générale, un cluster qui utilise le stockage SSD n'atteint un débit maximal que lorsqu'il utilise toute la capacité du processeur et de la mémoire disponible.
- Les lectures de lignes individuelles sont très lentes sur un disque dur HDD. En raison du temps de recherche du disque, le stockage HDD n'accepte que 5 % du nombre de lignes de lecture par seconde du stockage SSD. Cependant, les analyses à grande échelle sur plusieurs lignes ne sont pas affectées de manière aussi défavorable.
- Le stockage SSD est compatible avec une option de stockage hiérarchisé pour les données rarement consultées.
- Le niveau en mémoire (preview) n'est disponible que pour les instances qui utilisent le stockage SSD. Le stockage en mémoire nécessite l'édition Enterprise Plus.
L'un des inconvénients potentiels du stockage SSD est qu'il nécessite des nœuds supplémentaires dans les clusters en fonction de la quantité de données que vous stockez. En pratique, vous aurez sans doute besoin de ces nœuds supplémentaires pour que les clusters puissent suivre le trafic entrant, et pas uniquement pour stocker vos données.
Cas d'utilisation du stockage HDD
Le stockage HDD convient aux cas d'utilisation qui respectent tous les critères suivants :
- Vos charges de travail sont axées sur l'écriture et basées sur les données.
- Vos charges de travail ne sont pas sensibles à la latence.
- Vos données ne sont pas compatibles avec une application destinée aux utilisateurs.
- Vos charges de travail par lot se composent principalement d'analyses et d'écritures, avec quelques lectures aléatoires occasionnelles d'un petit nombre de lignes ou de lectures de points.
- Vous ne prévoyez pas d'utiliser le scaling de nœuds x2.
- Dans l'édition Enterprise Plus, vous prévoyez d'utiliser Data Boost pour les HDD.
Par exemple, si vous envisagez de stocker des données d'historique complètes pour un grand nombre de périphériques de détection à distance, puis de les utiliser pour générer des rapports quotidiens, les économies de coûts liées au stockage HDD peuvent justifier le compromis de performances. Par ailleurs, si vous prévoyez d’utiliser les données pour afficher un tableau de bord en temps réel, l’utilisation du stockage HDD ne serait probablement d'aucune utilité. Les opérations de lecture sont beaucoup plus fréquentes et lentes dans ce cas.
Basculer entre le stockage SSD et HDD
Lorsque vous créez une instance Bigtable, le choix du stockage SSD ou HDD est définitif. Vous ne pouvez pas utiliser la consoleGoogle Cloud pour modifier le type de stockage utilisé pour l'instance.
Si vous souhaitez modifier le type de stockage sur lequel une table est stockée, utilisez la fonctionnalité de sauvegarde :
- Créez ou prévoyez d'utiliser une instance utilisant le type de stockage souhaité.
- Créez une sauvegarde de la table.
- Restaurez à partir de la sauvegarde dans une nouvelle table de l'autre instance.
Étape suivante
- Créez une instance avec un stockage SSD ou HDD.
- En savoir plus sur le stockage par niveau