Optionale HBase-Komponente für Managed Service for Apache Spark

Die Installation der optionalen HBase-Komponente ist auf Managed Service for Apache Spark-Cluster beschränkt, die mit der Imageversion 1.5 oder 2.0 erstellt wurden.

bietet zwar viele Dienste, mit denen Sie selbstverwaltetes Apache HBase bereitstellen können, aber Bigtable ist oft die beste Option, da es eine offene API mit HBase und die Portabilität von Arbeitslasten bietet. Google Cloud HBase-Datenbanktabellen können zu Bigtable migriert werden, um die zugrunde liegenden Daten zu verwalten. Anwendungen, die zuvor mit HBase interagiert haben, z. B. Spark, können in Managed Service for Apache Spark verbleiben und sich sicher mit Bigtable verbinden. In dieser Anleitung finden Sie die allgemeinen Schritte für den Einstieg in Bigtable und Referenzen zum Migrieren von Daten aus Managed Service for Apache Spark-HBase-Bereitstellungen zu Bigtable.

Erste Schritte mit Bigtable

Cloud Bigtable ist eine hochgradig skalierbare und leistungsstarke NoSQL-Plattform, die Apache HBase API-Clientkompatibilität und Portabilität für HBase-Arbeitslasten bietet. Der Client ist mit den HBase API-Versionen 1.x und 2.x kompatibel und kann in die vorhandene Anwendung eingebunden werden, um Daten in Bigtable zu lesen und zu schreiben. Vorhandene HBase-Anwendungen können die Bigtable HBase-Clientbibliothek hinzufügen, um Daten zu lesen und zu schreiben, die in Bigtable gespeichert sind.

Weitere Informationen zum Konfigurieren Ihrer HBase-Anwendung mit Bigtable finden Sie unter Bigtable und die HBase API.

Bigtable-Cluster erstellen

Sie können mit Bigtable beginnen, indem Sie einen Cluster und Tabellen zum Speichern von Daten erstellen, die zuvor in HBase gespeichert waren. Folgen Sie der Anleitung in der Bigtable-Dokumentation, um eine Instanz, einen Cluster und Tabellen mit demselben Schema wie die HBase-Tabellen zu erstellen. Informationen zum automatischen Erstellen von Tabellen aus HBase Tabellen-DDLs finden Sie im Schemaübersetzungstool.

Öffnen Sie die Bigtable-Instanz in der Google Cloud Console, um die Tabelle und serverseitige Monitoringdiagramme wie Zeilen pro Sekunde, Latenz und Durchsatz aufzurufen und die neu bereitgestellte Tabelle zu verwalten. Weitere Informationen finden Sie unter Monitoring.

Daten von Managed Service for Apache Spark zu Bigtable migrieren

Nachdem Sie die Tabellen in Bigtable erstellt haben, können Sie Ihre Daten importieren und validieren. Folgen Sie dazu der Anleitung unter Daten von HBase zu Bigtable offline migrieren. Nachdem Sie die Daten migriert haben, können Sie Anwendungen aktualisieren, um Lese- und Schreibvorgänge an Bigtable zu senden.

Nächste Schritte