Vorlage „Bigtable-Änderungsstream zu BigQuery“ verwenden
In dieser Kurzanleitung erfahren Sie, wie Sie eine Bigtable-Tabelle mit aktiviertem Änderungsstream einrichten, eine Änderungsstreampipeline ausführen, Änderungen an Ihrer Tabelle vornehmen und dann sehen, wie die Änderungen gestreamt werden.
Hinweis
-
Wählen Sie in der Google Cloud Console auf der Seite für die Projektauswahl ein Google Cloud -Projekt aus oder erstellen Sie eines.
Rollen, die zum Auswählen oder Erstellen eines Projekts erforderlich sind
- Projekt auswählen: Für die Auswahl eines Projekts ist keine bestimmte IAM-Rolle erforderlich. Sie können jedes Projekt auswählen, für das Ihnen eine Rolle zugewiesen wurde.
-
Projekt erstellen: Zum Erstellen eines Projekts benötigen Sie die Rolle „Projektersteller“ (
roles/resourcemanager.projectCreator), die die Berechtigungresourcemanager.projects.createenthält. Weitere Informationen zum Zuweisen von Rollen
-
Prüfen Sie, ob für Ihr Google Cloud Projekt die Abrechnung aktiviert ist.
Aktivieren Sie die Dataflow API, die Cloud Bigtable API, die Cloud Bigtable Admin API und die BigQuery API.
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (
roles/serviceusage.serviceUsageAdmin), die die Berechtigungserviceusage.services.enableenthält. Weitere Informationen zum Zuweisen von Rollen-
Aktivieren Sie Cloud Shell in der Google Cloud Console.
BigQuery-Dataset erstellen
Erstellen Sie mit der Google Cloud Console ein Dataset, in dem die Daten gespeichert werden.
Rufen Sie in der Google Cloud Console die Seite "BigQuery" auf.
Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
Maximieren Sie die Option Aktionen und klicken Sie auf Dataset erstellen.
Führen Sie auf der Seite Dataset erstellen die folgenden Schritte aus:
- Geben Sie unter Dataset-ID
bigtable_bigquery_quickstartein. - Übernehmen Sie die verbleibenden Standardeinstellungen und klicken Sie auf Dataset erstellen.
- Geben Sie unter Dataset-ID
Tabelle mit aktiviertem Änderungsstream erstellen
Rufen Sie in der Google Cloud Console die Seite Bigtable-Instanzen auf.
Klicken Sie auf die ID der Instanz, die Sie für diese Kurzanleitung verwenden.
Wenn Sie keine Instanz haben, erstellen Sie eine Instanz mit den Standardkonfigurationen in einer Region in Ihrer Nähe.
Klicken Sie im linken Navigationsbereich auf Sicherungen.
Klicken Sie auf Tabelle erstellen.
Geben Sie der Tabelle den Namen
bigquery-changestream-quickstart.Fügen Sie eine Spaltenfamilie mit dem Namen
cfhinzu.Wählen Sie Änderungsstream aktivieren aus.
Klicken Sie auf Erstellen.
Suchen Sie auf der Bigtable-Seite Tabellen nach Ihrer Tabelle
bigquery-changestream-quickstart.Klicken Sie in der Spalte Änderungsstream auf Verbinden.
Wählen Sie im Dialogfeld BigQuery aus.
Klicken Sie auf Dataflow-Job erstellen.
Geben Sie Ihre Parameterwerte in die Parameterfelder ein. Sie müssen keine optionalen Parameter angeben.
- Legen Sie die Bigtable-Anwendungsprofil-ID auf
defaultfest. - Legen Sie das BigQuery-Dataset auf
bigtable_bigquery_quickstartfest.
- Legen Sie die Bigtable-Anwendungsprofil-ID auf
Klicken Sie auf Job ausführen.
Warten Sie, bis der Jobstatus Wird gestartet oder Wird ausgeführt lautet, bevor Sie fortfahren. Das dauert etwa 5 Minuten, nachdem der Job in die Warteschlange gestellt wurde.
Lassen Sie den Job auf einem Tab geöffnet, damit Sie ihn beim Bereinigen Ihrer Ressourcen beenden können.
Daten in Bigtable schreiben
Schreiben Sie in Cloud Shell einige Zeilen in Bigtable, damit das Änderungsprotokoll einige Daten in BigQuery schreiben kann. Solange Sie die Daten nach der Erstellung des Jobs schreiben, werden die Änderungen angezeigt. Sie müssen nicht warten, bis der Jobstatus
runninglautet.cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user123 cf:col1=abc cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user546 cf:col1=def cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user789 cf:col1=ghiErsetzen Sie Folgendes:
- PROJECT_ID: die ID des Projekts, das Sie verwenden
- BIGTABLE_INSTANCE_ID: die ID der Instanz, die die Tabelle
bigquery-changestream-quickstartenthält
Änderungsprotokolle in BigQuery ansehen
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und das Dataset
bigtable_bigquery_quickstart.Klicken Sie auf die Tabelle
bigquery-changestream-quickstart_changelog.Wenn Sie das Änderungsprotokoll aufrufen möchten, klicken Sie auf Vorschau.

Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:
Deaktivieren Sie den Änderungsstream für die Tabelle:
gcloud bigtable instances tables update bigquery-changestream-quickstart \ --project=PROJECT_ID --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-periodLöschen Sie die Tabelle
bigquery-changestream-quickstart:cbt --instance=BIGTABLE_INSTANCE_ID --project=PROJECT_ID deletetable bigquery-changestream-quickstartBeenden Sie die Änderungsstream-Pipeline:
Rufen Sie in der Google Cloud Console die Dataflow-Seite Jobs auf.
Wählen Sie den Streaming-Job aus der Jobliste aus.
Klicken Sie im Navigationsbereich auf Beenden.
Wählen Sie im Dialogfeld Job beenden die Option Abbrechen aus und klicken Sie dann auf Job beenden.
Löschen Sie das BigQuery-Dataset:
Rufen Sie in der Google Cloud Console die Seite "BigQuery" auf.
Suchen Sie im Bereich Explorer nach dem Dataset
bigtable_bigquery_quickstartund klicken Sie darauf.Klicken Sie auf Löschen, geben Sie
deleteein und klicken Sie dann auf Löschen, um den Löschvorgang zu bestätigen.
Optional: Löschen Sie die Instanz, wenn Sie für diese Kurzanleitung eine neue erstellt haben:
cbt deleteinstance BIGTABLE_INSTANCE_ID