Menggunakan template aliran perubahan Bigtable ke BigQuery
Dalam panduan memulai ini, Anda akan mempelajari cara menyiapkan tabel Bigtable dengan aliran perubahan yang diaktifkan, menjalankan pipeline aliran perubahan, membuat perubahan pada tabel, lalu melihat perubahan yang di-streaming.
Sebelum memulai
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataflow, Cloud Bigtable API, Cloud Bigtable Admin API, and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
In the Google Cloud console, activate Cloud Shell.
Di konsol Google Cloud , buka halaman BigQuery.
Di panel Explorer, klik nama project Anda.
Luaskan opsi Actions, lalu klik Create dataset.
Di halaman Create dataset, lakukan hal berikut:
- Untuk Dataset ID, masukkan
bigtable_bigquery_quickstart. - Jangan ubah setelan default lainnya, lalu klik Create dataset.
- Untuk Dataset ID, masukkan
Di konsol Google Cloud , buka halaman Instances Bigtable.
Klik ID instance yang Anda gunakan untuk panduan memulai ini.
Jika Anda tidak memiliki instance yang tersedia, buat instance dengan konfigurasi default di region terdekat.
Di panel navigasi kiri, klik Tabel.
Klik Buat tabel.
Beri nama tabel
bigquery-changestream-quickstart.Tambahkan grup kolom bernama
cf.Pilih Aktifkan aliran perubahan.
Klik Create.
Di halaman Tables Bigtable, cari tabel Anda
bigquery-changestream-quickstart.Di kolom Change stream, klik Connect.
Pada dialog, pilih BigQuery.
Klik Buat tugas Dataflow.
Di kolom parameter yang disediakan, masukkan nilai parameter Anda. Anda tidak perlu memberikan parameter opsional apa pun.
- Setel ID profil aplikasi Bigtable ke
default. - Tetapkan set data BigQuery ke
bigtable_bigquery_quickstart.
- Setel ID profil aplikasi Bigtable ke
Klik Jalankan tugas.
Tunggu hingga status tugas menjadi Starting atau Running sebelum melanjutkan. Proses ini memerlukan waktu sekitar 5 menit setelah tugas dimasukkan dalam antrean.
Biarkan tugas tetap terbuka di tab, sehingga Anda dapat menghentikan tugas saat membersihkan resource.
Di Cloud Shell, tulis beberapa baris ke Bigtable sehingga log perubahan dapat menulis beberapa data ke BigQuery. Selama Anda menulis data setelah tugas dibuat, perubahan akan muncul. Anda tidak perlu menunggu status tugas menjadi
running.cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user123 cf:col1=abc cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user546 cf:col1=def cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ set bigquery-changestream-quickstart user789 cf:col1=ghiGanti kode berikut:
- PROJECT_ID: ID project yang Anda gunakan
- BIGTABLE_INSTANCE_ID: ID instance yang berisi tabel
bigquery-changestream-quickstart
Di konsol Google Cloud , buka halaman BigQuery.
Di panel Explorer, luaskan project Anda dan set data
bigtable_bigquery_quickstart.Klik tabel
bigquery-changestream-quickstart_changelog.Untuk melihat log perubahan, klik Pratinjau.

Nonaktifkan aliran perubahan pada tabel:
gcloud bigtable instances tables update bigquery-changestream-quickstart \ --project=PROJECT_ID --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-periodHapus tabel
bigquery-changestream-quickstart:cbt --instance=BIGTABLE_INSTANCE_ID --project=PROJECT_ID deletetable bigquery-changestream-quickstartHentikan pipeline aliran perubahan:
Di konsol Google Cloud , buka halaman Tugas Dataflow.
Pilih tugas streaming Anda dari daftar tugas.
Di navigasi, klik Berhenti.
Dalam dialog Stop job, pilih Cancel, lalu klik Stop job.
Hapus set data BigQuery:
Di konsol Google Cloud , buka halaman BigQuery.
Di panel Explorer, temukan set data
bigtable_bigquery_quickstart, lalu klik.Klik Hapus, ketik
delete, lalu klik Hapus untuk mengonfirmasi.
Opsional: Hapus instance jika Anda membuat instance baru untuk panduan memulai ini:
cbt deleteinstance BIGTABLE_INSTANCE_ID
Membuat set data BigQuery
Gunakan konsol Google Cloud untuk membuat set data yang menyimpan data.
Membuat tabel dengan aliran perubahan yang diaktifkan
Menulis beberapa data ke Bigtable
Melihat log perubahan di BigQuery
Pembersihan
Agar akun Google Cloud Anda tidak dikenai biaya untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.