このページでは、自動設定フローを使用して AlloyDB for PostgreSQL ストリームを作成する方法について説明します。
自動ストリーム設定により、実行する必要がある手順の数を減らすことで、AlloyDB for PostgreSQL クラスタから BigQuery へのデータ移動プロセスが簡素化されます。このフローを使用すると、AlloyDB for PostgreSQL クラスタの概要ページから直接ストリームを作成できます。
AlloyDB for PostgreSQL デプロイは、プライマリ インスタンスを含むプライマリ クラスタで構成されます。セカンダリ クラスタとセカンダリ インスタンスを含めることもできます。Datastream は常に、プライマリ クラスタのプライマリ インスタンスからストリームを作成します。
Datastream は、ストリームとソース クラスタ間の VPC 接続の保護、データベース構成とストリーム接続リソースの作成を自動化します。
始める前に
- Datastream、Network Connectivity、Compute Engine の各 API を有効にします。
- Datastream リソースを作成して管理するために必要な Identity and Access Management(IAM)権限があることを確認します。詳細については、次のセクション をご覧ください。
- レプリケーション用のソース AlloyDB for PostgreSQL クラスタを作成して構成します。詳細については、 CDC 用に AlloyDB for PostgreSQL データベースを構成するをご覧ください。
ストリームを作成する前に、クラスタの論理レプリケーションを有効にすることをおすすめします。論理レプリケーションを有効にしない場合、Datastream が有効にしますが、これによりソース インスタンスが再起動します。
AlloyDB for PostgreSQL クラスタの論理レプリケーションを有効にする方法については、 CDC 用に AlloyDB for PostgreSQL データベースを構成するをご覧ください。
ソース クラスタが プライベート サービス アクセスを使用するように構成されていることを確認します。
必要な権限
自動ストリーム作成フローを使用するには、次の Identity and Access Management(IAM)ロールまたは権限が必要です。
- 必要な API を有効にしてネットワーク構成タスクを実行するための
serviceusage.services.enable、compute.networkAdmin。 - クラスタとインスタンスの構成タスク用の
alloydb.admin。 - Datastream がユーザーに代わって実行する管理タスク用の
datastream.admin。
ストリーム設定をカスタマイズする場合は、データベース管理者ユーザーに、レプリケートするスキーマに対する GRANT
権限と、ソースデータベース内の管理タスクと構造タスクに必要な追加の権限も必要です。ソースデータベースに接続して、次のコマンドを実行します。
GRANT alloydbsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE; GRANT SELECT on ALL TABLES IN SCHEMA "SCHEMA_NAME" to"USER_NAME" WITH GRANT OPTION; ALTER DEFAULT PRIVILEGES IN SCHEMA "SCHEMA_NAME" GRANT SELECT ON TABLES TO "USER_NAME" WITH GRANT OPTION; GRANT CREATE ON DATABASE "DATABASE_NAME" TO "USER_NAME";
将来のテーブル
将来のテーブルは、自動フロー中に認証するためにアカウントの詳細情報を提供するユーザーによって作成された場合にのみ、ストリームに自動的に追加されます。別のユーザーが将来のテーブルを作成した場合、そのユーザーはテーブルに対する SELECT 権限を Datastream リーダー ユーザーに明示的に付与する必要があります。
ストリームを作成して開始する
ストリームを作成して開始する手順は次のとおりです。
コンソール
ソース AlloyDB for PostgreSQL クラスタの概要ページに移動します。
データをストリーミングするプライマリ クラスタをクリックします。
次のいずれかの方法で、ストリームを自動的に作成して開始します。
- [クラスタの詳細] ページの [データ レプリケーション] で、 [ストリームを開始] をクリックします。
- [統合] セクションで、[BigQuery にデータをレプリケート] の [ストリームを開始] をクリックします。
- [Launchpad] タブの [他のプロダクトとシームレスに統合] で、[BigQuery にデータをレプリケート] をクリックします。Google Cloud
[データを複製するストリームの開始] ペインが開きます。
[**ストリーム設定**] で、作成するストリームのデフォルト設定を確認します 。
ソースデータベースを変更するには、対応するプルダウンを開いて別の値を選択します。
ストリームを作成して開始する準備ができたら、[ストリームを開始] をクリックします。
ストリーム設定を変更する必要がある場合は、[カスタマイズ] をクリックします。
ストリーム設定のカスタマイズ
[カスタマイズ] をクリックすると、[ストリーム設定のカスタバーズ] ページ が表示されます。ストリーム設定をカスタマイズするために必要な権限があることを確認してください。
使ってみる
- [使ってみる] ページの [ストリーム名] フィールドに、ストリームの名前を入力します。[ストリーム ID] フィールドには自動的に値が入力されます。
[インスタンス ユーザー アカウントの詳細を指定する] セクションで、認証方法を選択します。
IAM データベース認証: ユーザーに Identity and Access Management(IAM)プリンシパル ID が割り当てられている場合に使用できます。詳細については、 IAM プリンシパルをご覧ください。 このオプションを選択する場合は、ユーザーに
alloydbsuperuserロールとCREATEROLE権限を手動で付与する必要があります。- コンソールで、AlloyDB for PostgreSQL クラスタ ページに移動します。 Google Cloud
- AlloyDB for PostgreSQL クラスタを選択します。
- ナビゲーション メニューで [AlloyDB for PostgreSQL Studio] をクリックしてログインします。
- [エクスプローラ] ペインで、ユーザーに対して次のクエリを実行します。
GRANT alloydbsuperuser TO "USER_NAME"; ALTER ROLE "USER_NAME" CREATEROLE;
- 組み込みデータベース認証:
alloydbsuperuserロールを持つユーザーのユーザー名と パスワードを指定します。ユーザーにalloydbsuperuserロールがない場合は、IAM データベース認証セクションの手順に沿って手動で付与します。 組み込みデータベース認証を選択する場合は、レプリケートするテーブルに対するGRANT権限がユーザーに付与されていることも確認してください。
リージョン、暗号化、ラベルなど、ストリームの詳細を確認します。 必要に応じて、[ストリームの詳細] セクションを開いて変更を適用します。
[続行] をクリックします。
ソースの構成
[ソースの構成] ページで、データのレプリケート元となるデータベースを選択します。
[選択したオブジェクト] リストでは、デフォルトですべての利用可能なオブジェクトが選択されます。 リスト内のオブジェクトは、ストリーミングに必要な権限が付与されているオブジェクトです。選択したオブジェクトを変更するには、リストの選択を変更します。
バックフィル モードや同時バックフィル接続の最大数など、高度なストリーム構成を確認します。必要に応じて、[高度なストリーム構成] セクションを開いて変更を適用します。
[続行] をクリックします。
宛先の構成
- [宛先の構成] ページで、必要に応じて BigQuery の宛先設定を調整します。詳細については、 ストリームの宛先に関する情報を構成するをご覧ください。
ストリームを作成して開始する
[作成して開始] をクリックしてストリームを作成して開始するか、[開始せずに作成] をクリックしてストリームを作成し、後で Datastream で開始します。
自動的に実行されるタスクについて通知されます。
- Datastream は、内部 IP アドレス範囲、サブネットワーク、ネットワーク アタッチメントなど、必要な Virtual Private Cloud リソースを作成します。
- Datastream は、CDC 用にテーブルを構成し、レプリケーション スロットを設定し、データベース内のすべてのテーブルのパブリケーションを設定して、専用の Datastream ユーザーを作成します。
- Datastream は、プライベート接続構成とソースおよび移行先の接続プロファイルを作成します。
ストリームを作成して開始することを確認します。
ストリームをモニタリングする
基本的なストリームの詳細は、ソース インスタンスの概要ページで コンソール Google Cloud からモニタリングできます。このページには、ストリームのステータス、ストリーム名、宛先 BigQuery データセット、宛先プロジェクト ID などの情報が表示されます。
概要ページから、ストリームの開始や一時停止などのアクションを実行することもできます。より詳細なモニタリング情報については、ストリーム名をクリックして Datastream に移動します。
ストリームの削除
自動フローを使用して作成したストリームを削除すると、PostgreSQL レプリケーション スロットなどの一部のリソースが自動的に削除されます。 ただし、手動で削除する必要があるリソースもあります。
- パブリケーション。パブリケーションはデータベース管理者ユーザーを使用して作成され、そのオーナー(デフォルトでは作成者)のみが削除できます。
- Datastream リーダー ユーザー。
- Datastream のソース接続プロファイルと移行先の接続プロファイル
- プライベート接続リソース。
- 自動フローで作成されたすべてのネットワーク リソース(サブネットワークやネットワーク アタッチメントなど)。