Penginstalan komponen HBase opsional terbatas pada cluster Managed Service untuk Apache Spark yang dibuat dengan versi image 1.5 atau 2.0.
Meskipun Google Cloud menyediakan banyak layanan yang memungkinkan Anda men-deploy Apache HBase yang dikelola sendiri, Bigtable sering kali merupakan opsi terbaik karena menyediakan API terbuka dengan portabilitas HBase dan workload. Tabel database HBase dapat dimigrasikan ke Bigtable untuk pengelolaan data yang mendasarinya, sementara aplikasi yang sebelumnya beroperasi dengan HBase, seperti Spark, dapat tetap berada di Managed Service untuk Apache Spark dan terhubung dengan aman ke Bigtable. Dalam panduan ini, kami memberikan langkah-langkah tingkat tinggi untuk memulai Bigtable dan memberikan referensi untuk memigrasikan data ke Bigtable dari deployment HBase Managed Service untuk Apache Spark.
Mulai menggunakan Bigtable
Cloud Bigtable adalah platform NoSQL yang sangat skalabel dan berperforma tinggi yang menyediakan kompatibilitas klien Apache HBase API dan portabilitas untuk workload HBase. Klien ini kompatibel dengan HBase API versi 1.x dan 2.x serta dapat disertakan dengan aplikasi yang ada untuk membaca dan menulis ke Bigtable. Aplikasi HBase yang ada dapat menambahkan library klien HBase Bigtable untuk membaca dan menulis data yang disimpan di Bigtable.
Lihat Bigtable dan HBase API untuk mengetahui informasi selengkapnya tentang cara mengonfigurasi aplikasi HBase dengan Bigtable.
Membuat cluster Bigtable
Anda dapat mulai menggunakan Bigtable dengan membuat cluster dan tabel untuk menyimpan data yang sebelumnya disimpan di HBase. Ikuti langkah-langkah dalam dokumentasi Bigtable untuk membuat instance, cluster, dan tabel dengan skema yang sama dengan tabel HBase. Untuk pembuatan tabel otomatis dari DDL tabel HBase, lihat alat penerjemah skema.
Buka instance Bigtable di Google Cloud konsol untuk melihat tabel dan diagram pemantauan sisi server, termasuk baris per detik, latensi, dan throughput, untuk mengelola tabel yang baru di-provisioning. Untuk mengetahui informasi tambahan, lihat Pemantauan.
Memigrasikan data dari Managed Service untuk Apache Spark ke Bigtable
Setelah membuat tabel di Bigtable, Anda dapat mengimpor dan memvalidasi data dengan mengikuti panduan di Memigrasikan data dari HBase ke Bigtable secara offline. Setelah memigrasikan data, Anda dapat memperbarui aplikasi untuk mengirim operasi baca dan tulis ke Bigtable.
Langkah berikutnya
- Lihat contoh Wordcount Spark untuk menjalankan Spark dengan Bigtable.
- Tinjau opsi migrasi online dengan replikasi langsung dari HBase ke Bigtable.
- Tonton Cara Box memodernisasi database NoSQL-nya untuk memahami manfaat lainnya.