Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Mengimpor dari Cloud SQL ke Spanner

Halaman ini menjelaskan cara mengimpor data dari Cloud SQL untuk MySQL ke Spanner.

Proses ini menggunakan Cloud Shell on Google Cloud console untuk menjalankan perintah yang mengonfigurasi dan menjalankan tugas Dataflow untuk mengimpor database dari Cloud SQL ke Spanner.

Ringkasan proses

Proses impor melibatkan hal berikut:

Anda menyelesaikan alur kerja Google Cloud onconsole tempat Anda memberikan informasi tentang database sumber dan target:
- Detail database sumber: Nama instance Cloud SQL, nama database, dan kredensial Anda.
- Detail Spanner: Nama instance Spanner Anda, dan nama database. Perintah ini membuat database jika belum ada.
- Penyimpanan output: Nama bucket Cloud Storage untuk menyimpan file output.
Spanner membuka Cloud Shell dan mengisi perintah. Perintah ini melakukan tindakan berikut:
- Memigrasikan skema: Perintah ini memigrasikan skema menggunakan alat migrasi Spanner. Migrasi ini berjalan di Cloud Shell dan menggunakan alamat IP publik untuk terhubung ke instance Cloud SQL Anda. Karena Cloud Shell berada di jaringannya sendiri, Cloud Shell memerlukan akses ke Cloud SQL menggunakan alamat IP publik; namun, Anda tidak perlu memberikan izin daftar ke subnet mana pun terhadap alamat IP publik.
- Memulai migrasi data: Setelah alat memigrasikan skema, perintah ini akan memulai tugas Dataflow untuk migrasi data. Tugas ini membaca dari database sumber secara langsung melalui alamat IP pribadinya dan menulis ke Spanner. Tugas ini berjalan menggunakan akun layanan Compute Engine default. Terakhir, perintah ini mencetak URL tugas Dataflow.

Batasan

Batasan berikut berlaku:

Impor data ini hanya mendukung satu instance Cloud SQL untuk MySQL.
Konversi skema otomatis; Anda tidak dapat melakukan penyesuaian pada skema selama impor ini.
Impor data ini adalah pemuatan massal satu kali; impor ini tidak mendukung replikasi berkelanjutan.

Sebelum memulai

Sebelum mengimpor database, selesaikan prasyarat berikut:

Pastikan instance Cloud SQL Anda memiliki alamat IP publik dan alamat IP pribadi yang diaktifkan. Untuk mengetahui informasi selengkapnya, lihat Mengonfigurasi konektivitas IP publik dan Mengonfigurasi IP pribadi.
Buat pengguna dan sandi untuk instance Cloud SQL Anda yang dapat digunakan untuk mengkueri database.
Simpan sandi di Secret Manager. Anda memerlukan version ID versi secret. Untuk mengetahui informasi selengkapnya, lihat Membuat secret.
Pastikan Anda memiliki bucket Cloud Storage. Dataflow menggunakan bucket ini untuk menyimpan file konfigurasi dan output tugas Dataflow.
Pastikan Spanner dan Cloud SQL berada dalam Google Cloud project yang sama.
Aktifkan Dataflow, Cloud Storage, Spanner, Cloud SQL, dan Secret Manager API.
Peran yang diperlukan untuk mengaktifkan API
Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (roles/serviceusage.serviceUsageAdmin), yang berisi izin serviceusage.services.enable. Pelajari cara memberikan peran.
Aktifkan API

Peran yang diperlukan

Untuk memastikan akun layanan Compute Engine default memiliki izin yang diperlukan untuk menjalankan tugas Dataflow, minta administrator Anda untuk memberikan peran IAM berikut ke akun layanan Compute Engine default di project Anda:

Secret Manager Secret Accessor (roles/secretmanager.secretAccessor)
Cloud SQL Client (roles/cloudsql.client)
Cloud Spanner Database Admin (roles/spanner.databaseAdmin)
Storage Object Admin (roles/storage.objectAdmin)
Dataflow Worker (roles/dataflow.worker)

Untuk mendapatkan izin yang Anda perlukan untuk mengonfigurasi impor, minta administrator Anda untuk memberikan peran IAM berikut di project Anda:

Cloud SQL Client (roles/cloudsql.client)
Cloud Spanner Database Admin (roles/spanner.databaseAdmin)
Secret Manager Secret Accessor (roles/secretmanager.secretAccessor)
Storage Admin (roles/storage.admin)
Dataflow Developer (roles/dataflow.developer)
Service Account User (roles/iam.serviceAccountUser)

Peran bawaan ini berisi izin yang diperlukan untuk mengonfigurasi impor. Untuk melihat izin yang benar-benar diperlukan, perluas bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk mengonfigurasi impor:

cloudsql.instances.connect
cloudsql.instances.get
cloudsql.instances.login
spanner.instances.list
spanner.instances.get
spanner.databases.create
spanner.databases.list
spanner.databases.get
spanner.databases.getDdl
spanner.databases.updateDdl
spanner.databases.read
spanner.databases.write
spanner.databases.select
secretmanager.versions.access
storage.objects.create
storage.objects.get
storage.buckets.get
dataflow.jobs.create
dataflow.jobs.get
dataflow.jobs.list
iam.serviceAccounts.actAs

Persyaratan kuota

Persyaratan kuotanya adalah sebagai berikut:

Spanner: Anda harus memiliki kapasitas komputasi yang cukup untuk mendukung jumlah data yang Anda impor. Sebaiknya mulai dengan minimal satu node Spanner. Anda mungkin perlu menambahkan kapasitas komputasi agar tugas Anda selesai dalam waktu yang wajar. Tidak diperlukan kapasitas komputasi tambahan untuk mengimpor skema database. Untuk mengetahui informasi selengkapnya, lihat Ringkasan penskalaan otomatis
Dataflow: Tugas impor tunduk pada kuota Compute Engine CPU, penggunaan disk, dan alamat IP yang sama seperti tugas Dataflow lainnya.
Compute Engine: Sebelum menjalankan tugas impor, Anda harus menyiapkan kuota awal untuk Compute Engine, yang digunakan Dataflow. Kuota ini mewakili jumlah maksimum resource yang Anda izinkan untuk digunakan Dataflow untuk tugas Anda. Nilai awal yang direkomendasikan adalah:
- CPU: 200
- Alamat IP yang digunakan: 200
- Persistent disk standar: 50 TB
Umumnya, Anda tidak perlu melakukan penyesuaian lainnya. Dataflow menyediakan penskalaan otomatis sehingga Anda hanya membayar resource aktual yang digunakan selama impor. Jika tugas Anda dapat menggunakan lebih banyak resource, UI Dataflow akan menampilkan ikon peringatan. Tugas dapat selesai meskipun ada ikon peringatan.