Composant HBase facultatif de Dataproc

L'installation du composant HBase facultatif est limitée aux clusters Dataproc créés avec la version d'image 1.5 ou 2.0.

Bien que Google Cloud propose de nombreux services qui vous permettent de déployer Apache HBase autogéré, Bigtable est souvent la meilleure option, car il fournit une API ouverte avec HBase et une portabilité des charges de travail. Les tables de base de données HBase peuvent être migrées vers Bigtable pour la gestion des données sous-jacentes, tandis que les applications qui interagissaient auparavant avec HBase, telles que Spark, peuvent rester sur Dataproc et se connecter de manière sécurisée à Bigtable. Dans ce guide, nous fournissons les étapes générales pour commencer à utiliser Bigtable et des références pour migrer des données vers Bigtable à partir de déploiements Dataproc HBase.

Premiers pas avec Bigtable

Cloud Bigtable est une plate-forme NoSQL hautement évolutive et performante qui offre une compatibilité du client d'API Apache HBase et une portabilité pour les charges de travail HBase. Le client est compatible avec les versions 1.x et 2.x de l'API HBase et peut être inclus dans l'application existante pour lire et écrire dans Bigtable. Les applications HBase existantes peuvent ajouter la bibliothèque cliente Bigtable HBase pour lire et écrire des données stockées dans Bigtable.

Pour en savoir plus sur la configuration de votre application HBase avec Bigtable, consultez Bigtable et l'API HBase.

Créer un cluster Bigtable

Vous pouvez commencer à utiliser Bigtable en créant un cluster et des tables pour stocker les données qui étaient auparavant stockées dans HBase. Suivez les étapes de la documentation Bigtable pour créer une instance, un cluster et des tables avec le même schéma que les tables HBase. Pour la création automatisée de tables à partir de DDL de table HBase, reportez-vous à l' outil de traduction de schéma.

Ouvrez l'instance Bigtable dans Google Cloud la console pour afficher les graphiques de surveillance des tables et des serveurs, y compris les lignes par seconde, la latence et le débit, afin de gérer la table nouvellement provisionnée. Pour en savoir plus, consultez la section Surveillance.

Migrer des données de Dataproc vers Bigtable

Une fois les tables créées dans Bigtable, vous pouvez importer et valider vos données en suivant les instructions de la section Migrer des données de HBase vers Bigtable hors connexion. Une fois les données migrées, vous pouvez mettre à jour les applications pour envoyer des lectures et des écritures à Bigtable.

Étape suivante