Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Bigtable pour les utilisateurs d'Aerospike

Ce document aide les développeurs de logiciels et les administrateurs de bases de données à migrer des applications Aerospike existantes avec Bigtable en tant que base de données. Il s'appuie sur vos connaissances d'Aerospike pour décrire les concepts que vous devez comprendre avant de migrer vers Bigtable.

Pour vous aider à commencer à utiliser Bigtable et Aerospike, ce document effectue les opérations suivantes :

Compare la terminologie entre Aerospike et Bigtable.
Présente les opérations Bigtable et décrit la mise en page des données dans Bigtable.
Explique la modélisation des données et les principales considérations de conception.
Clarifie la façon dont la réplication est effectuée et son impact.

Pour en savoir plus sur le processus de migration et les outils Open Source que vous pouvez utiliser pour effectuer votre migration, consultez Migrer d'Aerospike vers Bigtable.

Comparaison terminologique

Aerospike et Bigtable sont toutes deux des bases de données NoSQL distribuées, mais elles diffèrent considérablement en termes de conception, de fonctionnement et de terminologie.

Aerospike stocke les données dans des enregistrements. Chaque enregistrement contient un ou plusieurs bins nommés, ainsi que des métadonnées telles que la taille de l'enregistrement (en octets), la valeur TTL (Time To Live) et la dernière heure de mise à jour (LUT).

Bigtable stocke les données dans des tables évolutives, chacune constituant un mappage de clés/valeurs triées. La table est composée de lignes indexées par des clés de ligne et de colonnes identifiées par un qualificatif de colonne. Les colonnes associées peuvent former une famille de colonnes. Cette structure vous permet de stocker plusieurs versions d'une valeur sous la même clé. Chaque version est identifiée par un code temporel unique. Les versions antérieures peuvent être filtrées lors des opérations de lecture ou supprimées par le biais de la récupération de mémoire en fonction des règles configurées.

Pour en savoir plus, consultez Modèle de stockage Bigtable.

Le tableau suivant décrit les concepts partagés et la terminologie correspondante utilisée par chaque produit :

Aerospike	Bigtable
Aucun élément ne correspond directement.	Instance : groupe géré de clusters dans différentes zones ou régions Google Cloud entre lesquelles la réplication et le routage de connexion se produisent.
cluster : déploiement Aerospike composé d'un ensemble de nœuds.	cluster : groupe de nœuds dans les mêmes zones géographiques Google Cloud .
Nœud : serveur fournissant des ressources de calcul et possédant son propre espace de stockage.	node : serveur qui ne fournit que du calcul. Le stockage est géré par Colossus, un système de fichiers distribué distinct.
namespace : stocke des paramètres tels que la valeur TTL ou le type de stockage. Dans un espace de noms, les données sont subdivisées en ensembles et en enregistrements.	table : l'équivalent le plus proche d'un espace de noms Aerospike. Certains paramètres sont définis pour toutes les tables au niveau du cluster. Il est possible d'exercer un contrôle plus précis au niveau des tables ou des familles de colonnes.
set : utilisé pour la division logique des enregistrements et des paramètres tels que la taille de la valeur TTL et du capping. Les clés doivent être uniques dans un ensemble.	Aucun élément ne correspond directement.
Aucun élément ne correspond directement.	table : ressource au niveau de l'instance qui est automatiquement répliquée sur chaque cluster. Une table contient un ensemble de valeurs identifiées par des clés de ligne uniques. Les tables sont partiellement remplies, ce qui signifie qu'elles n'utilisent pas d'espace supplémentaire pour stocker les colonnes qui ne contiennent aucune valeur.
Aucun élément ne correspond directement.	tablet : plage contiguë de lignes stockées ensemble. Bigtable utilise des tablets pour l'équilibrage de charge en les attribuant à des nœuds. Les limites des tablettes sont dynamiques. Elles peuvent être divisées ou fusionnées au fil du temps.
record : ensemble de bins nommés utilisés pour stocker des données. Elle ne doit pas dépasser 8 Mo.	Ligne : ensemble de valeurs identifiées par la famille de colonnes, le qualificatif de colonne et l'horodatage. Toutes les opérations sont atomiques au niveau des lignes.
Aucun élément ne correspond directement.	Famille de colonnes : groupe de colonnes triées par ordre lexicographique. La récupération de mémoire est définie à ce niveau.
bin : paire clé-valeur où le nom du bin est l'identifiant d'une valeur dans un enregistrement.	qualificatif de colonne : libellé d'une valeur stockée dans une table.
Aucun élément ne correspond directement.	cellule : libellé d'une valeur horodatée stockée dans une table.
Digest(enregistrement) : hachage d'un triplet identifiant un enregistrement : espace de noms, ensemble et clé.	Aucun élément ne correspond directement. Remarque : Lors de la migration, les résumés d'enregistrements sont utilisés comme clés de ligne dans Bigtable. Pour en savoir plus, consultez Conception des clés de ligne.
Heure de la dernière mise à jour (LUT) de l'enregistrement : code temporel de la dernière écriture dans un enregistrement.	Horodatage de cellule : version horodatée de la valeur pour l'intersection d'une ligne et d'une colonne comportant plusieurs cellules.
key : identifiant d'enregistrement unique dans un ensemble.	Clé de ligne : identifiant de ligne unique dans une table.
AQL : outil de ligne de commande permettant de parcourir les données et de développer des fonctions définies par l'utilisateur pour la base de données Aerospike.	GoogleSQL : langage de requête utilisé par plusieurs services Google Cloud , y compris Spanner, BigQuery et Bigtable.

Limites des types de données

Le tableau suivant compare les limites des types de données utilisés par Aerospike et Bigtable :

Aerospike	Bigtable
namespace : le nombre maximal d'espaces de noms pour l' édition Enterprise est de 32.	table : une instance peut comporter jusqu'à 1 000 tables. Le nom d'une table ne peut pas comporter plus de 50 caractères.
set : un cluster peut comporter jusqu'à 4 095 ensembles. Le nom d'un ensemble ne peut pas dépasser 63 octets.	Aucun élément ne correspond directement.
record : la taille maximale d'un enregistrement est de 8 Mo.	row : la taille maximale des lignes est de 256 Mo.
Aucun élément ne correspond directement.	Famille de colonnes : le nombre de familles de colonnes est illimité, mais au-delà de 100, les performances peuvent se dégrader.
bin : le nombre de bins est illimité, mais chacun d'eux ne peut contenir plus de 1 Mo de données. Le nom du bin ne peut pas dépasser 15 octets.	Qualificateur de colonne : la limite est de 100 Mo, mais il est recommandé de ne pas dépasser 10 Mo. Le nombre de colonnes est illimité.
key : la taille maximale de la clé est de 8 Ko.	Clé de ligne : la taille maximale de la clé de ligne est de 4 Ko.

Pour en savoir plus sur les limites de Bigtable, consultez Quotas et limites. Pour en savoir plus sur les limites d'Aerospike, consultez Limites et seuils du système Aerospike.

Architecture

Les sections suivantes présentent une vue d'ensemble de l'architecture de Bigtable et d'Aerospike.

Bigtable

Les nœuds Bigtable sont distincts de la couche de stockage, ce qui signifie qu'ils n'affectent pas la durabilité des données. Les clients de table Bigtable ne connaissent pas la distribution des données sous-jacentes. Une couche de routage supplémentaire distribue les requêtes au nœud approprié. Chaque nœud gère un sous-ensemble des requêtes adressées au cluster. Une table Bigtable est segmentée en blocs de lignes adjacentes, appelés tablets, qui sont stockés sur Colossus, un système de fichiers distribué offrant une durabilité élevée. Chaque tablet est associé à un nœud Bigtable spécifique.

Les clients du cluster Bigtable communiquent avec les nœuds via la couche de routage qui distribue les données au nœud approprié.

L'architecture de Bigtable offre les avantages suivants :

Les clients Bigtable n'ont pas besoin de connaître la distribution des données ni l'équilibrage de charge. Ces complexités sont gérées par la couche de routage.
Le rééquilibrage s'effectue très rapidement et la récupération après un échec est rapide, car les données réelles ne sont pas copiées entre les nœuds.
En cas d'échec d'un nœud Bigtable, aucune donnée n'est perdue.

Aerospike

Contrairement à Bigtable, le stockage Aerospike se trouve sur les nœuds qui le desservent. Chaque nœud (serveur) du cluster Aerospike est identique. Les données de chaque espace de noms sont divisées en exactement 4 096 partitions en hachant les noms des enregistrements. Ces partitions sont réparties de manière égale entre les nœuds.

Les nœuds se connaissent et rééquilibrent les partitions stockées lorsque le cluster change. Chaque fois qu'un cluster change, les réplicas élisent un réplica principal qui coordonne le rééquilibrage. Les bibliothèques clientes sont censées suivre la réplique qui stocke la partition principale et envoyer les requêtes d'écriture aux répliques appropriées. Si un client envoie une requête au mauvais nœud (ce qui peut se produire lors du rééquilibrage), la requête est redirigée par les nœuds.

Les clients du cluster Aerospike communiquent avec les nœuds qui gèrent le rééquilibrage de la charge de travail.

Réplication

Cette section compare le processus de réplication pour Aerospike et Bigtable.

Bigtable

Une instance Bigtable peut être constituée d'un seul cluster ou de plusieurs clusters répliqués. Une table est toujours répliquée sur tous les clusters d'une instance. Vous pouvez ajouter ou supprimer des clusters d'une instance avec un impact minimal sur les autres clusters.

Bigtable offre une cohérence écriture-lecture au sein d'un même cluster. Les écritures sont effectuées sur un seul cluster et deviennent cohérentes à terme dans les autres clusters de l'instance. Contrairement à Aerospike, Bigtable ne perd pas les mises à jour intermédiaires, car les cellules individuelles sont versionnées en interne, ce qui garantit qu'aucune écriture n'est perdue. Chaque cluster diffuse les cellules comportant les horodatages les plus récents.

L'API Bigtable propose un jeton de cohérence au niveau de la table, qui peut être utilisé pour vérifier si toutes les modifications apportées avant la création du jeton ont été entièrement répliquées.

Aerospike

Aerospike gère la réplication au sein d'un cluster au niveau de la partition. Un espace de noms est divisé en partitions qui sont réparties de manière égale entre les nœuds. La cohérence forte est assurée au sein d'un cluster. Une opération d'écriture n'est confirmée que lorsque toutes les répliques du cluster l'ont reconnue.

La réplication entre centres de données (XDR) peut être configurée pour la synchronisation des données entre différents clusters. La convergence des bins Aerospike garantit que les données sont identiques dans tous les centres de données à la fin de la réplication. Toutefois, les mises à jour intermédiaires peuvent être perdues.

Pour la durabilité, l'algorithme de cohérence basé sur les listes d'Aerospike nécessite N+1 copies pour gérer N défaillances.

Modèle de données

Cette section compare les modèles de données utilisés par Bigtable et Aerospike.

Schéma flexible

Aerospike n'applique pas de contraintes de schéma, ce qui permet à chaque enregistrement d'avoir des bins différents avec des types de valeurs variables. De même, Bigtable est compatible avec les colonnes éparses. Ainsi, aucun espace de stockage n'est consommé pour les colonnes sans valeur. Bien qu'il n'y ait pas de limite stricte au nombre de colonnes ou de familles de colonnes, nous vous recommandons de ne pas dépasser 100 familles de colonnes pour des raisons de performances.

Conception des clés de ligne

Bigtable identifie les lignes par des clés de ligne, qui doivent être uniques dans une table. Elles sont triées de manière lexicographique et regroupées dans des tablettes. Cela diffère d'Aerospike, où les enregistrements sont répartis sur les nœuds en fonction de leur hachage. Les clés de ligne doivent être conçues de manière à ce que les lignes fréquemment consultées ensemble soient également stockées ensemble.

Lors de la migration,Bigtable utilise les résumés d'enregistrements Aerospike comme clés de ligne pour les raisons suivantes :

Par défaut, Aerospike ne conserve pas les clés utilisateur. En fonction de la configuration, Aerospike limite la migration aux déploiements qui ont activé le stockage de clés avant l'écriture de données. Si vous activez le stockage de clés plus tard dans le processus, les clés ne seront pas renseignées de manière rétroactive.
Les clés d'enregistrement Aerospike peuvent atteindre 8 Ko, tandis que les clés de ligne Bigtable sont limitées à 4 Ko, ce qui rend leur réutilisation directe dangereuse.

Types de données

Aerospike accepte les types de données avancés, y compris les scalaires, GeoJSON, HyperLogLogs, les listes et les objets imbriqués. Ces types peuvent être indexés et interrogés avec la prise en charge des index secondaires. De plus, Aerospike fournit des API côté serveur qui permettent d'effectuer des opérations complexes sur ces types de données, comme le filtrage par géolocalisation ou la manipulation du contenu des listes.

L'API Cloud Bigtable gère principalement les octets bruts, à quelques exceptions près. Il utilise INT64 pour les codes temporels et les compteurs, que vous pouvez incrémenter de manière atomique. Le langage de requête est également compatible avec de nombreux types complexes, tels que les scalaires, les objets JSON et les bins HLL. Comme vous ne pouvez pas stocker de types avancés directement dans Bigtable, vous devez sérialiser toutes les données côté client. La bibliothèque d'adaptateurs peut vous aider pour la sérialisation.

Mappage des types

Lors de la migration d'Aerospike vers Bigtable, la bibliothèque d'adaptateurs permet de conserver les types Aerospike même si Bigtable ne les accepte pas.

Aerospike stocke des valeurs typées telles que des scalaires, des listes ou des cartes, tandis que Bigtable renvoie des cellules sans sémantique de type au niveau de l'application, ce qui nécessite une couche d'adaptation pour la récupération du type. La bibliothèque d'adaptateurs fournit l'encodage suivant :

Chaque bin scalaire est sérialisé avec des routines compatibles avec HBase et un marqueur de type intégré au qualificatif de colonne.
Les bins complexes, tels que les listes ou les cartes, sont divisés en colonnes distinctes.
Un qualificatif de colonne encode la position dans la liste ou la clé de carte échappée et le type scalaire.

La logique de décodage reconstruit les structures d'origine, ce qui permet d'obtenir un comportement cohérent avec Aerospike. La bibliothèque d'adaptateurs est également compatible avec les structures imbriquées.

Les exemples suivants illustrent la façon dont les enregistrements Aerospike sont mappés aux lignes Bigtable :

Type de données Enregistrement Aerospike Ligne Bigtable

Type de données	Enregistrement Aerospike	Ligne Bigtable
Scalaires	`integerBin` : 1 `floatBin` : 2.2 `stringBin` : "abc"	`<record's digest>: SCALARS:floatBin__FLOAT64 "@\x01\x99\x99\x99\x99\x99\x9a" SCALARS:integerBin__INT64 "\x00\x00\x00\x00\x00\x00\x00\x01" SCALARS:stringBin__STRING "abc"`
Objets	`listBin` : `[1,2]` `mapBin` : `{"x": 1}`	`<record's digest>: OBJECT:listBin__LIST__0__INT64 "\x00\x00\x00\x00\x00\x00\x00\x01" OBJECT:listBin__LIST__1__INT64 "\x00\x00\x00\x00\x00\x00\x00\x02" OBJECT:mapBin__MAP__x__INT64 "\x00\x00\x00\x00\x00\x00\x00\x01"`

Scalaires

integerBin : 1
floatBin : 2.2
stringBin : "abc"

<record's digest>:
  SCALARS:floatBin__FLOAT64
    "@\x01\x99\x99\x99\x99\x99\x9a"
  SCALARS:integerBin__INT64
    "\x00\x00\x00\x00\x00\x00\x00\x01"
  SCALARS:stringBin__STRING
    "abc"

Objets

listBin : [1,2]
mapBin : {"x": 1}

<record's digest>:
  OBJECT:listBin__LIST__0__INT64
    "\x00\x00\x00\x00\x00\x00\x00\x01"
  OBJECT:listBin__LIST__1__INT64
    "\x00\x00\x00\x00\x00\x00\x00\x02"
  OBJECT:mapBin__MAP__x__INT64
    "\x00\x00\x00\x00\x00\x00\x00\x01"

Famille de colonnes

Dans Bigtable, les familles de colonnes définissent les colonnes d'une table qui sont stockées et récupérées ensemble. Au moins une famille de colonnes doit exister pour chaque table. Regroupez les colonnes associées dans la même famille et séparez les données ayant des exigences de conservation différentes dans des familles de colonnes distinctes, car les règles de récupération de mémoire s'appliquent au niveau de la famille de colonnes.

Valeur TTL (Time To Live)

Dans Aerospike, vous pouvez définir une valeur TTL (Time To Live) au niveau de l'enregistrement. Dans Bigtable, vous configurez la valeur TTL au niveau de la famille de colonnes, mais vous pouvez simuler la valeur TTL par cellule. Après la migration, les codes temporels dans Bigtable ne correspondent pas directement aux LUT Aerospike. Si votre application utilise la valeur TTL dans Aerospike et nécessite le même comportement après la migration, vous devez choisir entre la valeur TTL au niveau de la famille de colonnes et la valeur TTL simulée par cellule. En fonction de votre décision, vous devez définir les codes temporels de toutes les cellules en conséquence.

Contrairement à Aerospike, qui exclut les enregistrements expirés des lectures, Bigtable peut continuer à les renvoyer jusqu'à ce que la récupération de mémoire les supprime. Pour correspondre au comportement d'Aerospike, appliquez des filtres de lecture pour exclure les enregistrements expirés.

Qualificatifs de colonne

Dans Bigtable, les qualificatifs de colonne sont utilisés au sein d'une famille de colonnes pour définir des colonnes individuelles. Les tables peuvent contenir des millions de colonnes. Toutefois, il est recommandé de limiter le nombre de colonnes dans une même ligne. Si vous le souhaitez, les qualificatifs de colonne peuvent être traités comme des données, ce qui permet d'intégrer directement les valeurs dans le nom de la colonne pour gagner de l'espace.

Cellules

Dans Bigtable, une cellule est l'intersection de la clé de ligne et du nom de la colonne (une famille de colonnes combinée à un qualificatif de colonne). Chaque cellule contient une ou plusieurs valeurs horodatées pouvant être fournies par le client ou appliquées automatiquement par le service.

Index secondaires

Les vues matérialisées continues peuvent servir d'index secondaires asynchrones, ce qui permet d'interroger les tables à l'aide de différents attributs ou modèles de recherche. Pour en savoir plus, consultez Créer un index secondaire asynchrone.

Transactions

Bigtable et Aerospike ne sont pas compatibles avec les transactions multilignes, mais diffèrent dans leurs capacités monolignes. Bigtable fournit des écritures à ligne unique et à cohérence totale au sein d'un cluster, et prend en charge les transactions à ligne unique via les requêtes mutate-row. Elles permettent d'effectuer plusieurs opérations sur une même ligne, toutes exécutées de manière atomique, et qui réussissent ou échouent toutes. Il existe également des opérations de lecture-modification-écriture et de vérification-mutation, mais elles ne sont pas disponibles avec les profils de routage multicluster. En revanche, Aerospike étend les transactions sur une seule ligne avec la manipulation des données côté serveur et l'exécution des fonctions définies par le client.

Équilibrage de charge et basculement

L'API client Aerospike gère l'équilibrage de charge. Ce processus côté client est conscient de l'état du cluster et de la distribution des données, et est responsable du routage des requêtes.

Si un nœud échoue ou qu'un nouveau nœud est ajouté, le cluster doit être rééquilibré. Un nœud principal temporaire est choisi pour orchestrer le rééquilibrage et la redistribution des partitions entre les nœuds. Pendant ce temps, le cluster reste opérationnel, mais le client doit suivre les modifications pour le routage des requêtes. Si une requête atteint le mauvais nœud, elle est acheminée en interne vers le bon.

Le client Bigtable est un client léger qui masque à l'utilisateur toutes les complexités, comme l'état du cluster et la distribution des données. L'acheminement de la requête est géré par la couche suivante, un client lourd à l'intérieur de l'infrastructure Bigtable Google Cloud.

Une autre différence réside dans la règle de routage, qui n'est pas disponible dans Aerospike. Bigtable utilise des profils d'application pour gérer le routage des requêtes, avec des priorités configurables pour contrôler l'ordre dans lequel les requêtes sont traitées. Il existe deux types de règles de routage : à cluster unique et multicluster. Un profil multicluster achemine les opérations vers le cluster disponible le plus proche. Les clusters d'une même région sont considérés comme étant équidistants du point de vue du routeur d'opérations. Si le nœud responsable de la plage de clés demandée est surchargé ou temporairement indisponible dans un cluster, ce profil assure le basculement automatique. En revanche, Aerospike ne fournit pas de basculement automatique en cas de défaillance complète du cluster.

Sauvegarde et restauration

Aerospike fournit des outils de sauvegarde et de restauration externes appelés asbackup et asrestore, qui créent des sauvegardes logiques côté client et sont analogues à l'exécution d'un scan. La gestion des sauvegardes peut également être effectuée via le service de sauvegarde Aerospike ou l'opérateur Kubernetes Aerospike, qui utilisent tous deux asbackup et asrestore en interne, et fournissent une planification et une coordination multiprocessus. Les sauvegardes ne sont pas atomiques, ce qui signifie que les opérations d'écriture effectuées pendant la sauvegarde peuvent ne pas être enregistrées.

Bigtable propose deux méthodes pour répondre aux besoins de sauvegarde courants : les sauvegardes Bigtable et les exportations de données gérées. Les sauvegardes créent des copies reproductibles d'une table, qui sont stockées en tant qu'objets membres d'un cluster. Vous pouvez restaurer des sauvegardes en tant que nouvelle table du cluster qui a déclenché la sauvegarde. Les sauvegardes sont conçues pour créer des points de restauration en cas de corruption au niveau de l'application. Les sauvegardes Bigtable ne sont pas non plus atomiques. Des modifications peuvent être apportées à une section de la table déjà copiée.

Principales différences dans la gestion des sauvegardes

Les sauvegardes Aerospike sont créées côté client. Ils ne nécessitent pas d'espace supplémentaire côté serveur, mais sont plus lents. Dans Bigtable, une sauvegarde partage l'espace de stockage physique avec la table source et les autres sauvegardes de la table.
Les utilisateurs d'Aerospike doivent gérer l'exportation, le stockage et la suppression des anciennes sauvegardes. Comme les sauvegardes dans Bigtable sont entièrement intégrées, toutes ces actions sont effectuées automatiquement par le service Bigtable.

Considérations sur les performances

Comme Aerospike et Bigtable traitent les opérations de lecture et d'écriture différemment, leurs performances varient. Il est important d'en tenir compte. Le tableau suivant inclut plusieurs exemples de différences de performances entre les deux bases de données. Pour en savoir plus, consultez les Consignes relatives aux performances de Bigtable.

Considération	Bigtable	Aerospike
Lignes chaudes	Distribue les tablets et les opérations pour égaliser l'utilisation des ressources. Une ligne fréquemment consultée peut être isolée dans un tablet d'une seule ligne sur un nœud, ce qui limite l'impact sur les autres lignes.	Distribue les lignes en fonction des hachages sur tous les nœuds, quel que soit le trafic. Une ligne chaude peut affecter les performances d'une partition entière.
Analyses sur les clés triées	Stocke les données de manière lexicographique, ce qui le rend très efficace pour le streaming de données triées.	Distribue les enregistrements en fonction des hachages. Par conséquent, l'analyse de nombreuses clés consécutives nécessite d'interroger plusieurs nœuds et d'agréger les résultats, ce qui peut être plus lent. Prend en charge les index secondaires, y compris les types avancés, ce qui peut réduire la nécessité d'effectuer des analyses.
Insertion de plusieurs clés consécutives	Stocke les données de manière lexicographique, ce qui signifie qu'un seul nœud gère de nombreuses opérations d'écriture de clés consécutives. Par conséquent, un modèle de lecture ou d'écriture peut se retrouver sur le nœud contenant la tablette responsable de la fin de l'espace de clé de ligne, ce qui le surcharge effectivement.	Distribue les clés en fonction du hachage, en répartissant la charge entre plusieurs nœuds lors de l'écriture de clés consécutives.
Lignes comportant un très grand nombre de colonnes	Bien que Bigtable puisse accepter des lignes jusqu'à 256 Mo, le traitement de lignes volumineuses peut avoir un impact sur les performances. Bigtable est optimisé pour les petites lignes. Par conséquent, réfléchissez à l'organisation des cellules et à l'accès aux données lors de la conception du schéma pour éviter de répartir inutilement les données sur de nombreuses cellules.	Les performances sont sous-optimales lorsqu'une ligne ou un enregistrement comporte un très grand nombre de colonnes ou de bins.
Démarrages à froid	Fonctionne mieux avec les tables volumineuses fréquemment consultées. Si vous commencez à envoyer des requêtes après une période d'inactivité (démarrage à froid), vous constaterez peut-être une latence élevée. Cela se produit parce que la répartition des tablettes et leur distribution entre les nœuds ne sont peut-être pas optimales, et parce que les caches sont froids. La distribution entre les nœuds peut ne pas être entièrement optimale pendant quelques minutes lors du démarrage à froid et du rééquilibrage.	Les performances ne changent pas au fil du temps, car la distribution des données n'est pas basée sur la charge. Alors que les caches doivent être préchauffés, les index sont conservés en mémoire, ce qui minimise le temps de recherche sur le disque et réduit l'importance de la mise en cache.
Plusieurs petites tables	Évitez de créer de nombreuses petites tables. Il est justifié d'utiliser des tables distinctes pour différents cas d'utilisation ou schémas, mais pas pour des données similaires, car cela n'améliore pas l'équilibrage de la charge et augmente la charge de gestion.	La plupart des enregistrements résident dans un espace de noms, regroupés en ensembles. Les ensembles n'ont pas de schémas spécifiques, mais des index secondaires ou des opérations d'analyse peuvent être définis par ensemble. La division des données en ensembles n'a aucune incidence sur les performances.
Ensemble de données volumineux	Capable de stocker des ensembles de données à l'échelle de l'exaoctet. Les performances ne sont pas affectées par la taille totale de l'ensemble de données en raison de son architecture et de la division dynamique des tables.	Techniquement, les bases de données Aerospike n'ont pas de limite de taille. Toutefois, Aerospike stocke les index et les enregistrements séparément. Les deux types de données peuvent être stockés sur différents types de périphériques de stockage pour améliorer les performances. Le stockage des index dans la RAM est essentiel pour réduire la latence, mais il peut ne pas être possible pour les ensembles de données très volumineux. Par exemple, avec 4 milliards d'objets et un facteur de réplication de 2 (RF2), la mémoire consommée en association avec l'index principal dans le cluster All Flash est de 2,5 Gio. En utilisant le même exemple dans une configuration de mémoire hybride, où l'index principal est en mémoire, 476,8 Gio de mémoire seraient utilisés.
Scaling	Le traitement et le stockage sont dissociés et peuvent être mis à l'échelle indépendamment. Un seul nœud peut gérer des blocs de données de plusieurs centaines de téraoctets, voire de pétaoctets.	Le stockage des index dans la RAM est essentiel pour obtenir une faible latence. Dans ce cas, les machines doivent être mises à l'échelle verticalement avec la capacité de stockage pour tenir compte de l'index principal.

Étapes suivantes

Découvrez la conception de schémas Bigtable.
En savoir plus sur Aerospike
Découvrez l'émulateur Bigtable.
Découvrez des architectures de référence, des schémas et des bonnes pratiques concernant Google Cloud. Consultez notre Cloud Architecture Center.

Bigtable pour les utilisateurs d'Aerospike Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Comparaison terminologique

Limites des types de données

Architecture

Bigtable

Aerospike

Réplication

Bigtable

Aerospike

Modèle de données

Schéma flexible

Conception des clés de ligne

Types de données

Mappage des types

Famille de colonnes

Valeur TTL (Time To Live)

Qualificatifs de colonne

Cellules

Index secondaires

Transactions

Équilibrage de charge et basculement

Sauvegarde et restauration

Principales différences dans la gestion des sauvegardes

Considérations sur les performances

Étapes suivantes

Bigtable pour les utilisateurs d'Aerospike