將資料插入資料表

插入資料時,系統會將新記錄和資料檔案附加至 Apache Iceberg 資料表。

為確保 Lakehouse 執行階段目錄的中繼資料一致性,寫入作業仍僅限於最初建立資料表的特定引擎 (例如 Spark 或 Trino)。

事前準備

請參閱表格總覽,瞭解不同類型的表格,以及使用這些表格的影響。

  1. 確認專案已啟用計費功能 Google Cloud

  2. 啟用 BigLake API。

    啟用 API 時所需的角色

    如要啟用 API,您需要服務使用情形管理員 IAM 角色 (roles/serviceusage.serviceUsageAdmin),其中包含 serviceusage.services.enable 權限。瞭解如何授予角色

    啟用 API

必要的角色

如要取得將資料插入資料表所需的權限,請要求系統管理員授予您專案和儲存空間 bucket 的下列 IAM 角色:

  • 憑證販售模式寫入資料表資料: BigLake 編輯器 (roles/biglake.editor) - 專案
  • 在非憑證臨時配發模式下寫入資料表資料:
    • BigLake 編輯者 (roles/biglake.editor) - 專案
    • Storage 物件使用者 (roles/storage.objectUser) - Cloud Storage 值區

如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和組織的存取權」。

您或許也能透過自訂角色或其他預先定義的角色,取得必要權限。

將資料插入資料表

將範例資料插入資料表:

Spark

spark.sql("INSERT INTO TABLE_NAME VALUES (1, \"first row\"), (2, \"second row\"), (3, \"third row\");")

Trino

INSERT INTO TABLE_NAME VALUES (1, 'first row'), (2, 'second row'), (3, 'third row');

後續步驟