Optionale HBase-Komponente in Dataproc

Die Installation der optionalen HBase-Komponente ist auf Dataproc-Cluster beschränkt, die mit Image-Version 1.5 oder 2.0 erstellt wurden.

bietet zwar viele Dienste, mit denen Sie selbstverwaltetes Apache HBase bereitstellen können, aber Bigtable ist oft die beste Option, da es eine offene API mit HBase und Portabilität der Arbeitslasten bietet. Google Cloud HBase-Datenbanktabellen können zu Bigtable migriert werden, um die zugrunde liegenden Daten zu verwalten. Anwendungen, die zuvor mit HBase interagiert haben, z. B. Spark, können in Dataproc verbleiben und eine sichere Verbindung zu Bigtable herstellen. In dieser Anleitung werden die allgemeinen Schritte für den Einstieg in Bigtable beschrieben und Referenzen für die Migration von Daten aus Dataproc-HBase-Bereitstellungen zu Bigtable bereitgestellt.

Erste Schritte mit Bigtable

Cloud Bigtable ist eine hochgradig skalierbare und leistungsstarke NoSQL-Plattform, die Apache HBase API-Clientkompatibilität und Portabilität für HBase-Arbeitslasten bietet. Der Client ist mit den HBase API-Versionen 1.x und 2.x kompatibel und kann in die vorhandene Anwendung eingebunden werden, um Daten in Bigtable zu lesen und zu schreiben. Vorhandene HBase-Anwendungen können die Bigtable-HBase-Clientbibliothek hinzufügen, um Daten zu lesen und zu schreiben, die in Bigtable gespeichert sind.

Weitere Informationen zum Konfigurieren Ihrer HBase-Anwendung mit Bigtable finden Sie unter Bigtable und die HBase API.

Bigtable-Cluster erstellen

Sie können mit Bigtable beginnen, indem Sie einen Cluster und Tabellen zum Speichern von Daten erstellen, die zuvor in HBase gespeichert waren. Folgen Sie der Anleitung in der Bigtable-Dokumentation, um eine Instanz, einen Cluster und Tabellen mit demselben Schema wie die HBase-Tabellen zu erstellen. Informationen zum automatischen Erstellen von Tabellen aus HBase Tabellen-DDLs finden Sie im Schemaübersetzungstool.

Öffnen Sie die Bigtable-Instanz in Google Cloud der Console, um die Tabelle und serverseitige Monitoring-Diagramme zu sehen, einschließlich Zeilen pro Sekunde, Latenz und Durchsatz, um die neu bereitgestellte Tabelle zu verwalten. Weitere Informationen finden Sie unter Monitoring.

Daten von Dataproc zu Bigtable migrieren

Nachdem Sie die Tabellen in Bigtable erstellt haben, können Sie Ihre Daten importieren und validieren. Folgen Sie dazu der Anleitung unter Daten von HBase zu Bigtable migrieren (Offline). Nachdem Sie die Daten migriert haben, können Sie Anwendungen aktualisieren, um Lese- und Schreibvorgänge an Bigtable zu senden.

Nächste Schritte