Menggunakan replikasi lintas region dan pemulihan dari bencana

Halaman ini menjelaskan cara menggunakan replikasi lintas-region dan pemulihan dari bencana BigLake metastore.

Fitur ini hanya tersedia untuk katalog yang menggunakan bucket Dual-Region atau Multi-Region Cloud Storage.

Sebelum memulai

  1. Verify that billing is enabled for your Google Cloud project.

  2. Enable the BigLake API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk menggunakan katalog REST Iceberg di metastore BigLake, minta administrator Anda untuk memberi Anda peran IAM berikut :

  • Lakukan tugas administratif, seperti mengelola akses pengguna katalog, akses penyimpanan, dan mode pemberian kredensial katalog:
  • Membaca data tabel dalam mode penyediaan kredensial: BigLake Viewer (roles/biglake.viewer) di project
  • Menulis data tabel dalam mode penyediaan kredensial: BigLake Editor (roles/biglake.editor) di project
  • Membaca resource katalog dan data tabel dalam mode penjualan non-kredensial:
  • Mengelola resource katalog dan menulis data tabel dalam mode penyediaan non-kredensial:

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Alur kerja replikasi dan pemulihan dari bencana

Untuk menggunakan replikasi lintas region dan pemulihan dari bencana, Anda harus mengikuti langkah-langkah umum berikut:

  1. Melihat status replikasi: Identifikasi region primer dan sekunder Anda saat ini untuk menentukan region target bagi failover.
  2. Periksa status sinkronisasi: Verifikasi status saat ini dari region primer dan sekunder Anda untuk memastikan keduanya siap untuk transisi.
  3. Pilih mode failover: Tentukan antara failover sementara (terbaik untuk pemeliharaan terencana) atau failover permanen (terbaik untuk pemulihan darurat).
  4. Mulai failover: Jalankan perintah yang sesuai dengan mode yang Anda pilih untuk mengganti region utama dan sekunder Anda.

Bersiap untuk failover

Identifikasi region utama Anda saat ini dan verifikasi status sinkronisasi region sekunder Anda. Kemudian, mulai failover.

Melihat status replikasi

Untuk menentukan region tempat katalog Anda direplikasi, jalankan perintah gcloud alpha biglake iceberg catalogs describe berikut.

gcloud alpha biglake iceberg catalogs describe CATALOG_NAME

Ganti CATALOG_NAME dengan nama katalog Anda.

Memeriksa status sinkronisasi

Sebelum memulai failover, periksa status sinkronisasi replika sekunder Anda dengan perintah alpha biglake iceberg failover:

gcloud alpha biglake iceberg catalogs failover CATALOG_NAME \
    --validate_only \
    --primary-replica PRIMARY_REPLICA_REGION

Ganti kode berikut:

  • CATALOG_NAME: nama katalog Anda.
  • PRIMARY_REPLICA_REGION: region yang akan ditetapkan sebagai replika utama baru.

Memulai failover

Fitur pemulihan dari bencana menggunakan replikasi metastore untuk menetapkan region primer dan sekunder. Semua metadata commit tabel ditayangkan dari region utama dan direplikasi ke region sekunder. Anda dapat mengalihkan region primer dan sekunder untuk katalog menggunakan operasi failover.

Failover sementara

Untuk memulai failover ringan, jalankan perintah alpha biglake iceberg failover berikut:

gcloud alpha biglake iceberg catalogs failover CATALOG_NAME \
    --primary-replica PRIMARY_REPLICA_REGION

Ganti kode berikut:

  • CATALOG_NAME: nama katalog Anda.
  • PRIMARY_REPLICA_REGION: region yang akan ditetapkan sebagai replika utama baru.

Failover paksa

Untuk memulai failover paksa, jalankan perintah alpha biglake iceberg failover berikut:

gcloud alpha biglake iceberg catalogs failover CATALOG_NAME \
    --primary-replica PRIMARY_REPLICA_REGION \
    --conditional-failover-replication-time=REPLICATION_TIMESTAMP

Ganti kode berikut:

  • CATALOG_NAME: nama katalog Anda.

  • PRIMARY_REPLICA_REGION: region yang akan ditetapkan sebagai replika utama baru.

  • REPLICATION_TIMESTAMP: stempel waktu RFC 3339 yang berfungsi sebagai titik pemeriksaan untuk replikasi. Proses replikasi memverifikasi bahwa replika berisi semua data yang di-commit hingga saat ini. Jika replika tidak berisi semua data yang di-commit sebelum stempel waktu ini, perintah akan gagal. Untuk memaksakan proses failover terlepas dari penundaan replikasi, tetapkan stempel waktu ini ke tanggal yang jauh di masa lalu.

Langkah berikutnya