自 2026 年 4 月 20 日起，BigLake 將改名為 Lakehouse for Apache Iceberg。BigLake metastore 現在稱為 Lakehouse 執行階段目錄。湖倉 API、用戶端程式庫、CLI 指令和 IAM 名稱維持不變，仍會參照 BigLake。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

什麼是 Lakehouse for Apache Iceberg？

Lakehouse for Apache Iceberg 是一種高效能儲存引擎，專為建構開放式資料湖倉而設計。透過整合 Apache Iceberg 開放資料表格式與 Google Cloud上的全代管企業級儲存空間，提供進階數據分析和 AI 的統一介面。

如要管理開放式資料表的中繼資料，Lakehouse for Apache Iceberg 會使用 Lakehouse 執行階段目錄。這項全代管的無伺服器中繼資料服務可提供不同系統的單一事實來源，集中探索資料，並免除在不同存放區之間同步處理中繼資料的需求。

Google Cloud 的Lakehouse可將儲存空間與運算資源區隔開來，確保分析和交易系統之間順暢互通。這個架構可讓多個引擎 (包括 Apache Spark、Apache Flink、Apache Hive、Trino 和 BigQuery) 存取單一事實來源，避免資料重複並確保洞察結果一致。

主要優點

無伺服器架構：Google Cloud 的 Lakehouse 可免除伺服器或叢集管理作業，減少作業負擔，並根據需求自動調度資源。對於運算工作負載，無伺服器批次和互動式工作階段可移除工作之間的資源爭用，並自動執行基礎架構維護作業。
統一資料管理和治理：與 Knowledge Catalog 整合，確保在多個引擎中集中定義及強制執行治理政策，並啟用語意搜尋、資料歷程和品質檢查。
儲存空間擴充功能：Google Cloud 的 Lakehouse 擴充了 Cloud Storage 的管理功能，納入自動分級和客戶自行管理的加密金鑰 (CMEK) 等功能。
全代管體驗：與 BigQuery 整合後，Google Cloud 的 Lakehouse 可提供全代管的數據分析和 AI 體驗。
高可用性和災難復原：Google Cloud 的 Lakehouse 提供跨區域複製和災難復原 (搶先版) 選項，確保資料高可用性。

用途

開放式湖倉：將 Cloud Storage 做為儲存層，並透過 Google Cloud 的 Lakehouse 提供 Apache Iceberg 資料的管理和控管介面。
分析和交易整合：直接在 PostgreSQL 適用的 AlloyDB (預先發布版) 中存取分析 Apache Iceberg 資料表，將分析資料與交易工作負載結合。
統一存取：讓不同引擎 (Apache Spark、Apache Flink、BigQuery) 透過一致的中繼資料與相同的 Apache Iceberg 資料表互動。
跨雲端分析和 AI：使用跨雲端 Lakehouse (預先發布版) 同步處理其他雲端供應商的 Metadata，透過 Apache Iceberg REST 目錄端點，使用 BigQuery 或外部開放原始碼引擎查詢資料，完全不需要遷移資料。
探索公開資料集：使用 Apache Iceberg REST 目錄端點輕鬆查詢高品質公開資料集，不必管理基礎架構。
Hive Metastore：使用 Hive 目錄 (預覽版)，將 Apache Spark 和 Apache Hive 等開放原始碼引擎連結至 Lakehouse 執行階段目錄。這樣一來，您就不必自行代管 Hive 中繼存放區 (HMS)，可減少營運負擔，同時在 BigQuery 中順暢地共用資料及直接查詢資料表。

介面和工具

您可以使用下列工具與 Google Cloud 的 Lakehouse 資源互動：

Google Cloud 控制台：使用控制台建立目錄、查看目錄屬性、查看稽核記錄，以及設定權限。
BigQuery SQL：使用標準 SQL DDL (資料定義語言) 建立及管理 Apache Iceberg 資料表，以及與 Lakehouse 執行階段目錄整合的外部資料表。
開放原始碼引擎：搭配 Lakehouse 執行階段目錄使用 Apache Spark、Apache Flink 和 Apache Hive 等引擎，即可讀取及寫入資料。
IDE 和 Notebook：使用互動式 Apache Spark Notebook 和 IDE 擴充功能 (例如 VS Code 適用的 Data Agent Kit (DAK) 擴充功能)，在開發環境中直接向 Google Cloud 進行驗證、互動式撰寫程式碼，以及管理 Notebook 工作階段。
自動化調度管理和 MLOps 工具：使用 Managed Service for Apache Airflow (原為 Cloud Composer) 和 Vertex AI 中的 Kubeflow Pipelines，整合無伺服器批次管道和目錄作業與自動化調度管理工作流程。
Lakehouse 執行階段目錄 API：使用 Apache Iceberg REST 目錄端點，透過與開放式 Apache Iceberg REST 規格相容的工具與服務互動。
支援 Apache Iceberg 資料表：支援 Apache Iceberg V2 資料表 (正式版) 和 V3 資料表 (預先發布版)。不支援 Iceberg V1 資料表。

後續步驟

瞭解 Google Cloud 的 Lakehouse 架構。

什麼是 Lakehouse for Apache Iceberg？ 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

主要優點

用途

介面和工具

後續步驟

什麼是 Lakehouse for Apache Iceberg？