クロスリージョンレプリケーションと障害復旧を使用する

このページでは、BigLake metastore のクロスリージョンレプリケーションと障害復旧を使用する方法について説明します。

この機能は、Cloud Storage のデュアルリージョンバケットまたはマルチリージョンバケットを使用するカタログでのみ使用できます。

始める前に

Verify that billing is enabled for your Google Cloud project.
Enable the BigLake API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.
Enable the API

必要なロール

BigLake metastore で Iceberg REST カタログを使用するために必要な権限を取得するには、次の IAM ロールを付与するよう管理者に依頼してください。

カタログユーザーアクセス、ストレージアクセス、カタログの認証情報ベンダーモードの管理などの管理タスクを行います。
- プロジェクトに対する BigLake 管理者（roles/biglake.admin）
- Cloud Storage バケットに対するストレージ管理者（roles/storage.admin）
認証情報ベンディングモードでテーブルデータを読み取る: プロジェクトに対する BigLake 閲覧者（roles/biglake.viewer）
認証情報ベンディングモードでテーブルデータを書き込む: プロジェクトに対する BigLake 編集者（roles/biglake.editor）
非認証情報ベンディングモードでカタログリソースとテーブルデータを読み取る:
- プロジェクトに対する BigLake 閲覧者（roles/biglake.viewer）
- Cloud Storage バケットに対する Storage オブジェクト閲覧者（roles/storage.objectViewer）
カタログリソースを管理し、認証情報ベンディングモード以外でテーブルデータを書き込む:
- プロジェクトに対する BigLake 編集者（roles/biglake.editor）
- Cloud Storage バケットに対する Storage オブジェクトユーザー（roles/storage.objectUser）

ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。

必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。

レプリケーションと障害復旧のワークフロー

クロスリージョンレプリケーションと障害復旧を使用するには、次の一般的な手順を行います。

レプリケーションステータスを表示する: 現在のプライマリリージョンとセカンダリリージョンを特定して、フェイルオーバーのターゲットリージョンを決定します。
同期ステータスを確認する: プライマリリージョンとセカンダリリージョンの現在の状態を確認して、移行の準備ができていることを確認します。
フェイルオーバーモードを選択する: ソフトフェイルオーバー（計画メンテナンスに最適）とハードフェイルオーバー（緊急復旧に最適）のいずれかを選択します。
フェイルオーバーを開始する: 選択したモードに対応するコマンドを実行して、プライマリリージョンとセカンダリリージョンを切り替えます。

フェイルオーバーの準備

現在のプライマリリージョンを特定し、セカンダリリージョンの同期ステータスを確認します。次に、フェイルオーバーを開始します。

レプリケーションのステータスを表示する

カタログが複製されるリージョンを確認するには、次の gcloud alpha biglake iceberg catalogs describe コマンドを実行します。

gcloud alpha biglake iceberg catalogs describe CATALOG_NAME

CATALOG_NAME は、カタログの名前に置き換えます。

同期ステータスを確認する

フェイルオーバーを開始する前に、alpha biglake iceberg failover コマンドを使用して、セカンダリレプリカの同期ステータスを確認します。

gcloud alpha biglake iceberg catalogs failover CATALOG_NAME \
    --validate_only \
    --primary-replica PRIMARY_REPLICA_REGION

次のように置き換えます。

CATALOG_NAME: カタログの名前。
PRIMARY_REPLICA_REGION: 新しいプライマリレプリカとして指定するリージョン。

フェイルオーバーを開始する

障害復旧機能では、メタストアレプリケーションを使用してプライマリリージョンとセカンダリリージョンを指定します。すべてのテーブルコミットメタデータはプライマリリージョンから提供され、セカンダリリージョンに複製されます。フェイルオーバーオペレーションを使用して、カタログのプライマリリージョンとセカンダリリージョンを切り替えることができます。

ソフトフェイルオーバー

ソフトフェイルオーバーを開始するには、次の alpha biglake iceberg failover コマンドを実行します。

gcloud alpha biglake iceberg catalogs failover CATALOG_NAME \
    --primary-replica PRIMARY_REPLICA_REGION

次のように置き換えます。

CATALOG_NAME: カタログの名前。
PRIMARY_REPLICA_REGION: 新しいプライマリレプリカとして指定するリージョン。

ハードフェイルオーバー

ハードフェイルオーバーを開始するには、次の alpha biglake iceberg failover コマンドを実行します。

gcloud alpha biglake iceberg catalogs failover CATALOG_NAME \
    --primary-replica PRIMARY_REPLICA_REGION \
    --conditional-failover-replication-time=REPLICATION_TIMESTAMP

次のように置き換えます。

CATALOG_NAME: カタログの名前。
PRIMARY_REPLICA_REGION: 新しいプライマリレプリカとして指定するリージョン。
REPLICATION_TIMESTAMP: レプリケーションのチェックポイントとして機能する RFC 3339 タイムスタンプ。レプリケーションプロセスでは、レプリカにこの時点までにコミットされたすべてのデータが含まれていることが確認されます。レプリカにこのタイムスタンプの前にコミットされたすべてのデータが含まれていない場合、コマンドは失敗します。レプリケーションの遅延に関係なくフェイルオーバープロセスを強制的に実行するには、このタイムスタンプを過去の日付に設定します。

注: この機能がプレビュー版の期間中は、REPLICATION_TIMESTAMP は Cloud Storage ファイルではなく、カタログメタデータのみを追跡します。データ損失の下限を維持するには、Cloud Storage のデータの可用性と耐久性に関するドキュメントをご覧ください。

次のステップ

BigLake metastore Iceberg REST カタログを使用する

クロスリージョン レプリケーションと障害復旧を使用する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

始める前に

必要なロール

レプリケーションと障害復旧のワークフロー

フェイルオーバーの準備

レプリケーションのステータスを表示する

同期ステータスを確認する

フェイルオーバーを開始する

ソフト フェイルオーバー

ハード フェイルオーバー

次のステップ

クロスリージョンレプリケーションと障害復旧を使用する

ソフトフェイルオーバー

ハードフェイルオーバー