Choisir entre le stockage SSD et HDD
Lorsque vous créez une instance Bigtable, vous devez choisir si ses clusters stockent les données sur des disques durs SSD ou HDD :
- Le stockage SSD constitue le choix le plus efficace et le plus rentable dans la plupart des cas.
- Le stockage HDD est parfois approprié pour les grands ensembles de données non sensibles à la latence ou rarement utilisés.
Les instances Bigtable qui utilisent le stockage SSD sont compatibles avec le stockage hiérarchisé (aperçu). Vous pouvez activer un niveau de stockage à accès peu fréquent au niveau de la table sur les clusters SSD, où vous pouvez stocker les données auxquelles vous accédez rarement de la manière la plus économique possible. Pour en savoir plus, consultez Présentation du stockage par niveaux.
Quel que soit le type de stockage que vous choisissez, vos données sont stockées sur un système de fichiers répliqués et distribués qui englobe de nombreux disques physiques.
Le tableau suivant compare les types de stockage Bigtable dans le contexte du stockage hiérarchisé :
Instance et niveau | Capacité des nœuds | Latence attendue | Opérations | Application idéale |
---|---|---|---|---|
Instance SSD, niveau de stockage SSD | 5 To | Écriture/Lecture : quelques millisecondes | Écrire, lire, mettre à jour, supprimer | Charges de travail à haut débit d'écriture/lecture et à faible latence |
Instance SSD, stockage à plusieurs niveaux activé | 32 To (jusqu'à 5 To de SSD) | Écriture : de l'ordre de la milliseconde Lecture : quelques dizaines de millisecondes |
Écrire, lire, mettre à jour, supprimer | Grands ensembles de données avec des données rarement consultées |
Instance HDD, niveau HDD | 16 To | Écriture : de l'ordre de la milliseconde Lecture : quelques dizaines de millisecondes |
Écrire, lire, mettre à jour, supprimer | Ensembles de données volumineux avec des charges de travail insensibles à la latence |
Pour en savoir plus sur les performances des types de stockage Bigtable, consultez Analyser les performances.
En cas de doute, choisir le stockage SSD
En règle générale, il est recommandé d'utiliser le stockage SSD pour votre cluster Bigtable, et ce pour plusieurs raisons :
- Les disques durs SSD sont nettement plus rapides et offrent des performances plus prévisibles que les disques durs HDD. Dans un cluster Bigtable, le stockage SSD présente des latences bien plus faibles pour les lectures et les écritures que le stockage HDD.
- Le débit du disque dur HDD est beaucoup plus limité que celui du disque dur SSD. Dans un cluster qui utilise le stockage HDD, il est possible d'atteindre le débit maximal avant que l'utilisation du processeur n'atteigne 100 %, une situation que vous pouvez surveiller à l'aide de la métrique de charge du disque. Pour augmenter le débit, vous devez ajouter d'autres nœuds. En revanche, le coût des nœuds supplémentaires est susceptible de dépasser les économies que vous avez réalisées grâce à l'utilisation du stockage HDD. Cette limite ne s'applique pas au stockage SSD, car il offre beaucoup plus de débit par nœud. En règle générale, un cluster qui utilise le stockage SSD n'atteint un débit maximal que lorsqu'il utilise toute la capacité du processeur et de la mémoire disponible.
- Les lectures de lignes individuelles sont très lentes sur un disque dur HDD. En raison du temps de recherche du disque, le stockage HDD n'accepte que 5 % du nombre de lignes de lecture par seconde du stockage SSD. Cependant, les analyses à grande échelle sur plusieurs lignes ne sont pas affectées de manière aussi défavorable.
- Le stockage SSD est compatible avec une option de stockage hiérarchisé pour les données rarement consultées.
L'un des inconvénients potentiels du stockage SSD est qu'il nécessite des nœuds supplémentaires dans les clusters en fonction de la quantité de données que vous stockez. En pratique, vous aurez sans doute besoin de ces nœuds supplémentaires pour que les clusters puissent suivre le trafic entrant, et pas uniquement pour stocker vos données.
Cas d'utilisation du stockage HDD
Le stockage HDD convient aux cas d'utilisation qui respectent tous les critères suivants :
- Vos charges de travail sont axées sur l'écriture et les données.
- Vos charges de travail ne sont pas sensibles à la latence.
- Vos données ne sont pas compatibles avec une application destinée aux utilisateurs.
- Vos charges de travail par lot se composent principalement d'analyses et d'écritures, avec quelques lectures aléatoires occasionnelles d'un petit nombre de lignes ou de lectures de points.
- Vous ne prévoyez pas d'utiliser Data Boost, le stockage hiérarchisé ni la mise à l'échelle des nœuds par deux.
Par exemple, si vous envisagez de stocker des données d'historique complètes pour un grand nombre de périphériques de détection à distance, puis de les utiliser pour générer des rapports quotidiens, les économies de coûts liées au stockage HDD peuvent justifier le compromis de performances. Par ailleurs, si vous prévoyez d’utiliser les données pour afficher un tableau de bord en temps réel, l’utilisation du stockage HDD ne serait probablement d'aucune utilité. Les opérations de lecture sont beaucoup plus fréquentes et lentes dans ce cas.
Basculer entre le stockage SSD et HDD
Lorsque vous créez une instance Bigtable, le choix du stockage SSD ou HDD est définitif. Vous ne pouvez pas utiliser la consoleGoogle Cloud pour modifier le type de stockage utilisé pour l'instance.
Si vous souhaitez modifier le type de stockage sur lequel une table est stockée, utilisez la fonctionnalité de sauvegarde :
- Créez ou prévoyez d'utiliser une instance utilisant le type de stockage souhaité.
- Créez une sauvegarde de la table.
- Restaurez à partir de la sauvegarde dans une nouvelle table de l'autre instance.
Étape suivante
- Créez une instance avec un stockage SSD ou HDD.
- En savoir plus sur le stockage par niveau