2026 年 4 月 20 日より、BigLake は Lakehouse for Apache Iceberg に名称変更されました。BigLake metastore は、Lakehouse ランタイムカタログと呼ばれるようになりました。Lakehouse API、クライアントライブラリ、CLI コマンド、IAM 名は変更されず、引き続き BigLake を参照します。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

テーブルのタイプと機能について

Lakehouse for Apache Iceberg は複数のテーブルタイプをサポートしており、でのレイクハウスに対してさまざまなレベルの管理、パフォーマンス、相互運用性を提供します。 Google Cloudデータの発生元、書き込みエンジンの要件、制御のニーズに応じて、 Lakehouse ランタイムカタログまたは BigQuery でサポートされているテーブル形式を選択できます。

カタログとエンジン別のテーブル形式

サポートされているテーブル形式、メタストア構成、ストレージ最適化機能、エンジンの相互運用性については、以下のカタログまたはエンジンを選択してください。

Iceberg REST カタログ

Lakehouse ランタイムカタログは、Iceberg REST カタログエンドポイントを介して Apache Iceberg テーブルを管理し、Apache Spark、Apache Flink、Trino などのオープンソースエンジンとの幅広い互換性を実現する標準の REST インターフェースを提供します。これらのテーブルは、オープンソースエンジンから作成して Cloud Storage に保存します。ETL ワークフローをオープンソースエンジンで管理し、BigQuery からの読み取りアクセスのみが必要な場合は、このオプションが最適です。

主な特長は以下のとおりです。

Metastore: Lakehouse ランタイムカタログ。
ストレージ: Cloud Storage。
ストレージ最適化: お客様または第三者によって管理されます。
読み取り / 書き込みアクセス:
- オープンソースエンジン: 読み取りと書き込み。
- BigQuery: 読み取り専用。
ユースケース: 高度な分析、ストリーミング、AI 向けの高性能なエンタープライズグレードのストレージを備えたオープンレイクハウス。

Hive メタストア

Lakehouse ランタイムカタログは、Apache Spark ExternalCatalog の互換性に最適化された Apache Hive メタストア（HMS）エンドポイントを介して Apache Hive テーブルを管理し、Apache Spark、Apache Hive、BigQuery 間でデータをシームレスに共有できるようにします。これらのテーブルは、オープンソースエンジンから作成して Cloud Storage に保存します。ETL ワークフローをオープンソースエンジンで管理し、個別のセルフホスト Hive メタストアを必要とせず、BigQuery からの読み取りアクセスのみが必要な場合は、このオプションが最適です。

主な特長は以下のとおりです。

Metastore: Lakehouse ランタイムカタログ（カスタム IMetastoreClient 経由）。
ストレージ: Cloud Storage（Parquet、ORC、 Avro などの形式をサポート）。
ストレージ最適化: お客様または第三者によって管理されます。
読み取り / 書き込みアクセス:
- オープンソースエンジン（Spark と Hive）: 読み取りと書き込み。
- BigQuery: 読み取り専用。
ユースケース: 既存の Spark ワークロードと Hive ワークロードをフルマネージドサーバーレスメタストアに移行する Google Cloud。

BigQuery

BigQuery は、Apache Iceberg テーブル、ネイティブテーブル、外部テーブルをサポートしています。

Apache Iceberg テーブル: これらは、BigQuery から作成して管理し、Cloud Storage に保存する Apache Iceberg テーブルです。オープンソースエンジンで読み取ることはできますが、メタデータを管理して書き込むエンジンは BigQuery です。ワークフローを BigQuery で完全に管理する場合は、このオプションが最適です。
ネイティブテーブル: これらはネイティブ BigQuery テーブルです。フルマネージドで、最先端の分析機能と管理機能が備わっています。このオプションは、Iceberg 以外のワークロードに最適です。
外部テーブル: これらのテーブルは、Cloud Storage、Amazon S3、Azure Blob Storage に保存されたデータ用の BigQuery 固有の構造です。データとメタデータはセルフマネージドで、BigQuery は読み取りアクセス権のみを持ちます。サードパーティカタログまたはストレージで直接管理するデータには、このオプションを選択します。

テーブルタイプを比較する

次の表を使用して、Lakehouse ランタイムカタログと BigQuery のテーブルタイプを比較します。

Lakehouse

	Apache Iceberg（GA）	Apache Hive（プレビュー）
Metastore	Lakehouse ランタイムカタログ	Lakehouse ランタイムカタログ
ストレージ	Cloud Storage	Cloud Storage
ストレージ最適化	お客様または第三者による管理	お客様または第三者による管理
読み取り / 書き込み	オープンソースエンジン（読み取り/書き込み） BigQuery（読み取り専用）	オープンソースエンジン（読み取り/書き込み） BigQuery（読み取り専用）
高度なオペレーション	なし	なし
ユースケース	オープンレイクハウス	既存の Spark ワークロードと Hive ワークロードをフルマネージドサーバーレスメタストアに移行する

BigQuery

	BigQuery 管理の Iceberg	外部テーブル	標準テーブル
Metastore	BigQuery	外部またはセルフホストのメタストア	BigQuery
ストレージ	Cloud Storage	Cloud Storage / Amazon S3 / Azure	BigQuery
ストレージ最適化	Google が管理	お客様または第三者による管理	Google が管理
読み取り / 書き込み	オープンソースエンジン（Iceberg ライブラリでの読み取り専用、BigQuery Storage API との読み取り/書き込みの相互運用性） BigQuery（読み取り/書き込み）	オープンソースエンジン（読み取り/書き込み） BigQuery（読み取り専用）	オープンソースエンジン（ BigQuery Storage API との読み取り/書き込みの相互運用性） BigQuery（読み取り/書き込み）
高度なオペレーション	BigQuery Storage Write API、変更データキャプチャ（CDC）、複数ステートメントトランザクションによる高スループットストリーミング	なし	BigQuery Storage Write API、変更データキャプチャ（CDC）、複数ステートメントトランザクションによる高スループットストリーミング
ユースケース	高度な分析、ストリーミング、AI 向けの高性能なエンタープライズグレードのストレージを備えたオープンレイクハウス	BigQuery ロード用のステージングテーブル、レガシークエリ専用テーブル	高度な分析、ストリーミング、AI 向けのエンタープライズグレードのストレージ

次のステップ

Apache Iceberg テーブルを管理する方法を学習する。
Dataflow を使用して外部 Iceberg テーブルをインポートする方法を学習する。
BigQuery でカタログ連携を使用する方法を学習する。

テーブルのタイプと機能について コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

カタログとエンジン別のテーブル形式

Iceberg REST カタログ

Hive メタストア

BigQuery

テーブルタイプを比較する

Lakehouse

BigQuery

次のステップ

テーブルのタイプと機能について