Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cloud SQL から Spanner にインポートする

このページでは、Cloud SQL for MySQL から Spanner にデータをインポートする方法について説明します。

このプロセスでは、 Google Cloud コンソールで Cloud Shell を使用して、 Cloud SQL から Spanner にデータベースをインポートする Dataflow ジョブを構成して実行するコマンドを実行します。

プロセスの概要

インポートプロセスには次の手順が含まれます。

コンソールワークフローを完了して、ソースデータベースとターゲットデータベースに関する情報を提供します。
- ソースデータベースの詳細: Cloud SQL インスタンス名、データベース名、認証情報。
- Spanner の詳細: Spanner インスタンス名とデータベース名。データベースが存在しない場合は、コマンドによって作成されます。
- 出力ストレージ: 出力ファイルを保存する Cloud Storage バケット名。
Spanner は Cloud Shell を開き、コマンドを入力します。このコマンドは次のアクションを実行します。
- スキーマを移行する: コマンドは、 Spanner 移行ツールを使用してスキーマを移行します。この移行は Cloud Shell で実行され、パブリック IP アドレスを使用して Cloud SQL インスタンスに接続します。Cloud Shell は独自のネットワーク上にあるため、パブリック IP アドレスを使用して Cloud SQL にアクセスする必要があります。ただし、パブリック IP アドレスに対してサブネットを許可リストに登録する必要はありません。
- データ移行を開始する: ツールがスキーマを移行すると、コマンドはデータ移行の Dataflow ジョブを開始します。ジョブは、プライベート IP アドレスを介してソースデータベースから直接読み取り、Spanner に書き込みます。このジョブは、デフォルトの Compute Engine サービスアカウントを使用して実行されます。最後に、コマンドは Dataflow ジョブの URL を出力します。

制限事項

次の制限が適用されます。

このデータインポートでは、単一の Cloud SQL for MySQL インスタンスのみがサポートされます。
スキーマ変換は自動化されています。このインポート中にスキーマを調整することはできません。
このデータインポートは 1 回限りの一括ロードであり、継続的なレプリケーションはサポートされていません。

始める前に

データベースをインポートする前に、次の前提条件を満たしてください。

Cloud SQL インスタンスにパブリック IP アドレスとプライベート IP アドレスが有効になっていることを確認します。詳細については、パブリック IP 接続を構成するとプライベート IP を構成するをご覧ください。
データベースのクエリに使用できる Cloud SQL インスタンスのユーザーとパスワードを作成します。
パスワードを Secret Manager に保存します。Secret のバージョンの version ID が必要です。詳細については、シークレットの作成をご覧ください。
Cloud Storage バケットがあることを確認します。Dataflow はこのバケットを使用して、構成ファイルと Dataflow ジョブの出力を保存します。
Spanner と Cloud SQL が同じ Google Cloud プロジェクトにあることを確認します。
Dataflow、Cloud Storage、Spanner、Cloud SQL、Secret Manager の各 API を有効にします。
API を有効にするために必要なロール
API を有効にするには、serviceusage.services.enable 権限を含む Service Usage 管理者 IAM ロール（roles/serviceusage.serviceUsageAdmin）が必要です。詳しくは、ロールを付与する方法をご覧ください。
API を有効にする

必要なロール

デフォルトの Compute Engine サービスアカウントに Dataflow ジョブを実行するために必要な権限があることを確認するには、プロジェクトに対する次の IAM ロールをデフォルトの Compute Engine サービスアカウントに付与するよう管理者に依頼します:

Secret Manager のシークレットアクセサー（roles/secretmanager.secretAccessor）
Cloud SQL クライアント（roles/cloudsql.client）
Cloud Spanner データベース管理者（roles/spanner.databaseAdmin）
Storage オブジェクト管理者（roles/storage.objectAdmin）
Dataflow ワーカー（roles/dataflow.worker）

インポートを構成するために必要な権限を取得するには、プロジェクトに対する次の IAM ロールを付与するよう管理者に依頼します。

Cloud SQL クライアント（roles/cloudsql.client）
Cloud Spanner データベース管理者（roles/spanner.databaseAdmin）
Secret Manager のシークレットアクセサー（roles/secretmanager.secretAccessor）
ストレージ管理者（roles/storage.admin）
Dataflow デベロッパー（roles/dataflow.developer）
サービスアカウントユーザー（roles/iam.serviceAccountUser）

これらの事前定義ロールにはインポートの構成に必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。

必要な権限

インポートを構成するには、次の権限が必要です。

cloudsql.instances.connect
cloudsql.instances.get
cloudsql.instances.login
spanner.instances.list
spanner.instances.get
spanner.databases.create
spanner.databases.list
spanner.databases.get
spanner.databases.getDdl
spanner.databases.updateDdl
spanner.databases.read
spanner.databases.write
spanner.databases.select
secretmanager.versions.access
storage.objects.create
storage.objects.get
storage.buckets.get
dataflow.jobs.create
dataflow.jobs.get
dataflow.jobs.list
iam.serviceAccounts.actAs

割り当て要件

割り当て要件は次のとおりです。

Spanner: インポートするデータの量をサポートできるだけの十分なコンピューティング容量が必要です。Spanner ノードを 1 つ以上から始めることをおすすめします。ジョブが妥当な時間内に終了するように、コンピューティング容量を追加する必要がある場合があります。データベーススキーマをインポートするために追加のコンピューティング容量は必要ありません。詳細については、自動スケーリングの概要をご覧ください。
Dataflow: インポートジョブは、他の Dataflow ジョブと同じ CPU、ディスク使用量、IP アドレスの Compute Engine の割り当てに従います。
Compute Engine: インポートジョブを実行する前に、Dataflow によって使用される Compute Engine の初期割り当てを設定する必要があります。これらの割り当ては、Dataflow でジョブに使用できる最大リソース数を表します。推奨の開始値は次のとおりです。
- CPU: 200
- 使用中の IP アドレス: 200
- 標準永続ディスク: 50 TB
通常、他の調整は必要ありません。Dataflow では自動スケーリングが提供されているため、インポート中に実際に使用したリソースに対してのみ料金を支払います。ジョブでより多くのリソースが使用される可能性がある場合、Dataflow UI に警告アイコンが表示されます。警告アイコンが表示されてもジョブは完了します。