2026 年 4 月 20 日より、BigLake は Lakehouse for Apache Iceberg に名称変更されました。BigLake metastore は、Lakehouse ランタイムカタログと呼ばれるようになりました。Lakehouse API、クライアントライブラリ、CLI コマンド、IAM 名は変更されず、引き続き BigLake を参照します。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Apache Iceberg REST カタログエンドポイントのコンセプト

Lakehouse for Apache Iceberg は、 Lakehouse ランタイムカタログを使用してメタデータを管理します。Apache Iceberg REST カタログのエンドポイントを使用すると、データは厳格なリソース階層に整理されます。カタログ構成によって、サポートされるストレージタイプ、リージョンルーティングの動作、クエリフェデレーションオプションが決まります。

機能とコンプライアンス

Lakehouse ランタイムカタログは、標準のテーブル形式をサポートし、オープン API に準拠することで、Iceberg 準拠のクエリエンジンと統合できるように構築されています。

サポートされているテーブル形式

Apache Iceberg V2 テーブル（一般提供）と V3 テーブル（プレビュー）がサポートされています。 Iceberg V1 テーブルはサポートされていません。既存の V1 テーブルを Apache Iceberg REST カタログエンドポイントで使用する前に、サポートされているバージョンにアップグレードする必要があります。詳細については、Iceberg V1 テーブルを V2 にアップグレードするをご覧ください。

API コンプライアンスと REST オペレーション

Lakehouse ランタイムカタログは、オープンスタンダードの Apache Iceberg REST カタログ API を実装しています。クライアントクエリエンジンは、標準の REST カタログ API を使用してカタログとやり取りします。詳細については、Lakehouse で Apache Iceberg REST カタログ API を実装する方法をご覧ください。

リソース階層

Apache Iceberg REST カタログエンドポイントは、リソースの階層を使用してデータを整理します。次の表に、これらのリソースの概要を示します。

リソース	説明
カタログ	最上位のコンテナであるカタログを使用すると、名前空間とテーブルを論理グループに整理できます。そのためには、名前空間とテーブルを異なるカタログに分割します。各カタログは、基盤となるメタデータとデータファイルを保存する指定のウェアハウスストレージロケーション（Cloud Storage バケットや BigQuery フェデレーションプロキシなど）によってサポートされます。
名前空間	カタログ内のテーブルを整理するために使用される論理グループ。データベース、スキーマ、ディレクトリのように機能します。
テーブル	テーブルには、クエリ可能な行と列の定義が含まれています。

カタログとストレージロケーション

カタログの構成によって、カタログの動作と Google Cloud サービスとの統合方法が決まります。複数バケット（bl://）カタログ（推奨）または単一バケット（gs://）カタログを構成できます。

どちらのオプションでも、きめ細かいアクセス制御のための認証情報ベンダーがサポートされています。

複数バケット（`bl://`）カタログ（推奨）

この方法では、バケット名とは関係なくカタログに名前を付け、1 つのカタログに複数のバケットを構成できます。基盤となる API では、これは CATALOG_TYPE_BIGLAKE 構成に対応します。

考慮事項:

デフォルトの場所: デフォルトのストレージの場所として機能するバケット（default_location）またはサブパス（gs://my-bucket/path など）へのパスを指定します。すべてのカタログリソース（名前空間とテーブル）は、指定したパスの下に配置する必要があります。たとえば、gs://my-bucket/path を指定した場合、gs://my-bucket/another/path の下に名前空間やテーブルをホストすることはできません。ロケーションを指定せずに作成された名前空間には、default_location が使用されます。
制限付きロケーション: 名前空間とテーブルを作成できる追加のバケットまたはパスに対して、オプションの restricted_locations構成を指定することもできます。サブパス（gs://my-bucket/path など）を指定した場合、その構成を使用して作成されたリソースはそのパスの下に配置する必要があります（たとえば、gs://my-bucket/another/path は名前空間やテーブルをホストできません）。
地理的リージョングループの要件: バケットはプロジェクト間、リージョン間、構成が異なる（単一リージョン、デュアルリージョン、マルチリージョンなど）場合がありますが、デフォルトのロケーションと制限付きロケーションのすべての Cloud Storage ロケーションは、同じ地理的リージョングループ（米国、ヨーロッパ、カナダ、アジアなど）に存在する必要があります。たとえば、米国のマルチリージョンバケットをヨーロッパまたはカナダのバケットで構成することはできません。
バケットあたりの複数のカタログ: 複数のカタログで同じバケットを参照できます（たとえば、デフォルトのロケーションや制限付きロケーションが異なる場合）。ただし、この構成はメタデータの競合、誤ったデータの上書き、権限漏洩などのセキュリティ上の問題につながる可能性があるため、強く推奨されません。
名前空間: デフォルトのロケーションまたは制限付きロケーションで構成されたパスの下にある限り、カスタムの名前空間ロケーションを指定できます。これらのカタログで作成されたテーブルには、競合を避けるために、物理パスにランダムな文字列の接尾辞が自動的に追加されます（例: gs://{bucket_name}/{namespace_name}/{table_name}/{random_suffix}）。詳細については、テーブルの管理とセキュリティルールをご覧ください。

単一バケット（`gs://`）カタログ

これは、カタログが指定した単一の Cloud Storage バケット内の Apache Iceberg メタデータとデータファイルを直接管理するレガシーアプローチです。基盤となる API では、これは CATALOG_TYPE_GCS_BUCKET 構成に対応します。

単一バケットカタログの場合、カタログ名はバケットの名前に設定されます。

たとえば、カタログを保存するバケットを作成して iceberg-bucket という名前を付けた場合、カタログ名とバケット名はどちらも iceberg-bucket になります。これは、P.C.N.T 構文を使用して BigQuery でカタログにクエリを実行するときに使用されます。例: my-project.lakehouse-catalog-id.quickstart_namespace.quickstart_table

考慮事項:

レガシーカタログタイプの制限事項 。新しいプロジェクトでは、レガシーの単一バケット構成を使用することは強く推奨されません。この構成には、次のような重要な制限があります。
- カタログ名: 基盤となる Cloud Storage バケット名にロックされます。
- プロジェクト: バケットのプロジェクトにロックされます（プロジェクト間のカタログは対象外です）。
- リージョン: バケットのロケーションから厳密に派生し、カスタマイズできません。
- ストレージ: カタログを単一のバケットに制限します（制限付きロケーションはありません）。
バケットごとに 1 つのカタログという制限: このレガシーカタログタイプでは、バケットごとに 1 つのカタログしか使用できず、カタログ名はバケット名と一致する必要があります。
複数バケット（bl://）カタログへのアップグレード（推奨）: 既存の単一バケット（gs://）カタログを複数バケット（bl://）カタログ（推奨）にアップグレードできます。アップグレードされたカタログは、元のバケットの名前を保持します。その後、複数のバケットをカタログに関連付けて、制限付きロケーションを構成できます。

バケットとカタログのリージョン

Lakehouse ランタイムカタログ内のカタログエンドポイントのリージョンは、基盤となる Cloud Storage バケットのリージョンによって決まります。

複数バケット（bl://）カタログ （推奨）: カタログのリージョンは、 default_location で構成されたバケットから派生します。
単一バケット（gs://）: カタログのリージョンは、カタログに関連付けられたバケットから厳密に派生し、カスタマイズできません。

マッピングされたカタログのリージョンは、バケットのリージョンタイプによって異なります。

単一リージョン: カタログのリージョンはバケットのリージョンと完全に一致します。
デュアルリージョン: カタログのリージョンはバケットのデュアルリージョン（や ASIA1 など）と一致します。NAM4
マルチリージョン: カタログのリージョンは、マルチリージョンの地理的ドメイン内の特定のリージョンロケーションに設定されます。デフォルトでは、US や EU などの一般的な BigQuery マルチリージョンと一致しない場合があります（たとえば、US マルチリージョンバケットは us-central1 または us-east4 にマッピングされます）。

BigQuery は、これらのカタログ内のテーブルに対してクエリを実行すると、クエリをカタログのプライマリリージョンにルーティングします。特定の仮想リージョン（US や EU など）のテーブルにクエリを実行し、そのロケーションにカタログメタデータが存在しない場合、クエリは失敗します。

マルチリージョンのプライマリリージョン

BigQuery が US または EU マルチリージョンからカタログテーブルにクエリを実行できるようにするには、カタログの作成時にプライマリリージョンとして US または EU を指定します。

次の構成では、マルチリージョン（US または EU）をプライマリリージョンとして指定できます。

default_location バケットが次のいずれかの場合:

US または EU のマルチリージョンバケット。
これらのマルチリージョン内の単一リージョンバケット（us-central1 や europe-west4 など）。
これらのエリア内のデュアルリージョンバケットまたはカスタムデュアルリージョンバケット（NAM4 や EUR4 など）。

プライマリレプリカはカタログの作成時に定義されますが、FailoverCatalog を呼び出すことでフェイルオーバーを動的に実行できます。詳細については、カタログを作成するをご覧ください。

BigQuery からカタログにクエリを実行する

BigQuery から Lake101house ランタイムカタログテーブルにクエリを実行する場合は、4 つの部分からなる命名構造を使用します。これは 101P.C.N.T と呼ばれます。

Project: カタログを所有する Google Cloud プロジェクト ID。
Catalog: Lakehouse ランタイムカタログの名前。
Namespace: Apache Iceberg 名前空間（ BigQuery データセットと同等）。
Table: テーブルの名前。

例: my-project.lakehouse-catalog-id.my-namespace.my-table

次のステップ

Apache Iceberg REST カタログエンドポイントを設定する

Apache Iceberg REST カタログ エンドポイントのコンセプト コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。