Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

從 Cloud SQL 匯入至 Spanner

本頁面說明如何將資料從 MySQL 適用的 Cloud SQL 匯入 Spanner。

這個程序會使用 Google Cloud 控制台上的 Cloud Shell 執行指令，設定及執行 Dataflow 工作，將資料庫從 Cloud SQL 匯入 Spanner。

流程總覽

匯入程序包括下列步驟：

您會完成 Google Cloud 控制台工作流程，提供來源和目標資料庫的相關資訊：
- 來源資料庫詳細資料：Cloud SQL 執行個體名稱、資料庫名稱和您的憑證。
- Spanner 詳細資料：您的 Spanner 執行個體名稱和資料庫名稱。如果資料庫尚不存在，這項指令會加以建立。
- 輸出儲存空間：用來儲存輸出檔案的 Cloud Storage bucket 名稱。
Spanner 會開啟 Cloud Shell 並填入指令。這個指令會執行下列動作：
- 遷移結構定義：這項指令會使用 Spanner 遷移工具遷移結構定義。這項遷移作業會在 Cloud Shell 中執行，並使用公開 IP 位址連線至 Cloud SQL 執行個體。由於 Cloud Shell 位於專屬網路，因此需要使用公開 IP 位址存取 Cloud SQL；不過，您不需要針對公開 IP 位址將任何子網路加入許可清單。
- 開始遷移資料：工具遷移結構定義後，這項指令會啟動 Dataflow 工作，開始遷移資料。這項作業會透過來源資料庫的私人 IP 位址直接讀取資料，並寫入 Spanner。這項工作會使用預設的 Compute Engine 服務帳戶執行。最後，指令會列印 Dataflow 工作網址。

限制

限制如下：

這項資料匯入作業僅支援單一 MySQL 適用的 Cloud SQL 執行個體。
結構定義轉換是自動進行，您無法在匯入期間調整結構定義。
這項資料匯入作業是一次性大量載入，不支援持續複製。

事前準備

匯入資料庫前，請先完成下列必要條件：

確認 Cloud SQL 執行個體已啟用公開 IP 位址和私人 IP 位址。詳情請參閱「設定公開 IP 連線」和「設定私人 IP」。
為 Cloud SQL 執行個體建立使用者和密碼，可用於查詢資料庫。
將密碼儲存在 Secret Manager 中。您需要密鑰版本的 version ID。詳情請參閱「建立密鑰」。
確認您有 Cloud Storage bucket。Dataflow 會使用這個值區儲存設定檔和 Dataflow 工作的輸出內容。
確認 Spanner 和 Cloud SQL 位於同一個 Google Cloud專案。
啟用 Dataflow、Cloud Storage、Spanner、Cloud SQL 和 Secret Manager API。
啟用 API 時所需的角色
如要啟用 API，您需要服務使用情形管理員 IAM 角色 (roles/serviceusage.serviceUsageAdmin)，其中包含 serviceusage.services.enable 權限。瞭解如何授予角色。
啟用 API

必要的角色

如要確保預設的 Compute Engine 服務帳戶具備執行 Dataflow 工作所需的權限，請要求系統管理員授予專案中預設的 Compute Engine 服務帳戶下列 IAM 角色：

Secret Manager 密鑰存取者 (roles/secretmanager.secretAccessor)
Cloud SQL 用戶端 (roles/cloudsql.client)
Cloud Spanner 資料庫管理員 (roles/spanner.databaseAdmin)
Storage 物件管理員 (roles/storage.objectAdmin)
Dataflow 工作者 (roles/dataflow.worker)

如要取得設定匯入作業所需的權限，請要求系統管理員在專案中授予您下列 IAM 角色：

Cloud SQL 用戶端 (roles/cloudsql.client)
Cloud Spanner 資料庫管理員 (roles/spanner.databaseAdmin)
Secret Manager 密鑰存取者 (roles/secretmanager.secretAccessor)
儲存空間管理員 (roles/storage.admin)
Dataflow 開發人員 (roles/dataflow.developer)
服務帳戶使用者 (roles/iam.serviceAccountUser)

這些預先定義的角色具備設定匯入作業所需的權限。如要查看確切的必要權限，請展開「Required permissions」(必要權限) 部分：

所需權限

如要設定匯入作業，您必須具備下列權限：

cloudsql.instances.connect
cloudsql.instances.get
cloudsql.instances.login
spanner.instances.list
spanner.instances.get
spanner.databases.create
spanner.databases.list
spanner.databases.get
spanner.databases.getDdl
spanner.databases.updateDdl
spanner.databases.read
spanner.databases.write
spanner.databases.select
secretmanager.versions.access
storage.objects.create
storage.objects.get
storage.buckets.get
dataflow.jobs.create
dataflow.jobs.get
dataflow.jobs.list
iam.serviceAccounts.actAs

配額需求

配額規定如下：

Spanner：您必須要有足夠的運算容量來支援匯入的資料量。建議您至少從一個 Spanner 節點開始。您可能需要增加運算容量，以便在合理的時間內完成工作。匯入資料庫結構定義不需要額外運算資源。詳情請參閱「自動調度資源總覽」。
Dataflow：匯入工作在 CPU、磁碟使用率和 IP 位址方面的 Compute Engine 配額限制與其他 Dataflow 工作相同。
Compute Engine：執行匯入工作前，您必須先為 Compute Engine 設定初始配額，以供 Dataflow 使用。這些配額代表您允許 Dataflow 為工作使用的資源數量「上限」。我們建議的起始值如下：
- CPU：200
- 使用中的 IP 位址：200
- 標準永久磁碟：50 TB
一般來說，您不需再進行其他調整。 Dataflow 會自動調度資源，因此您只要支付匯入期間實際用到的資源費用。如果您的工作可能會使用更多資源，Dataflow UI 將出現警告圖示，即使出現警告圖示，工作仍可順利完成。