Tabellen im Lakehouse Iceberg-REST-Katalog verwalten

Lakehouse für Apache Iceberg unterstützt das Erstellen, Verwalten und Abfragen von Lakehouse Iceberg REST-Katalogtabellen, die in Cloud Storage gespeichert sind.

Diese Tabellen werden über den Lakehouse-Laufzeitkatalog verwaltet und können von BigQuery und verbundenen Open-Source-Engines gelesen werden. Schreibvorgänge bleiben auf die Engine beschränkt, mit der die Tabelle ursprünglich erstellt wurde. Zusätzlich zur Integration der Abfrage-Engine implementiert der Lakehouse-Laufzeitkatalog die Open-Source-Spezifikation der Iceberg REST Catalog API. Dadurch können kompatible REST-Clients direkt mit Tabellenressourcen interagieren.

Hinweis

In der Tabellenübersicht finden Sie Informationen zu den verschiedenen Arten von Tabellen und den Auswirkungen ihrer Verwendung.

  1. Prüfen Sie, ob für Ihr Google Cloud Projekt die Abrechnung aktiviert ist.

  2. Aktivieren Sie die BigLake API.

    Rollen, die zum Aktivieren von APIs erforderlich sind

    Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (roles/serviceusage.serviceUsageAdmin), die die Berechtigung serviceusage.services.enable enthält. Weitere Informationen zum Zuweisen von Rollen

    API aktivieren

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihr Projekt und Ihren Speicher-Bucket zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Verwalten von Lakehouse Iceberg REST-Katalogtabellen benötigen:

  • Tabellen erstellen und löschen:
    • BigLake-Administrator (roles/biglake.admin) – das Projekt
    • Storage-Administrator (roles/storage.admin): der Cloud Storage-Bucket
  • Tabellendaten im Credential Vending Mode lesen: BigLake Viewer (roles/biglake.viewer) – das Projekt
  • Tabellendaten im Credential Vending Mode schreiben: BigLake-Editor (roles/biglake.editor) – das Projekt
  • Tabellendaten im Modus ohne Bereitstellung von Anmeldedaten lesen:
    • BigLake Viewer (roles/biglake.viewer): das Projekt
    • Storage-Objekt-Betrachter (roles/storage.objectViewer) – der Cloud Storage-Bucket
  • Tabellendaten im Modus ohne Bereitstellung von Anmeldedaten schreiben:
    • BigLake Editor (roles/biglake.editor): das Projekt
    • Storage Object User (roles/storage.objectUser) – der Cloud Storage-Bucket

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Verwaltungsaktionen

Sie können die folgenden Verwaltungsaktionen für Ihre Lakehouse Iceberg-REST-Katalogtabellen ausführen:

  • Tabelle erstellen:Erstellen Sie eine Apache Iceberg-Tabelle in einem Katalognamespace mit der Google Cloud -Konsole, Spark, Trino oder der Iceberg REST Catalog API (CreateIcebergTable).
  • Tabellen auflisten:Tabellenkennungen in einem Namespace mit der Google Cloud Console, Spark, Trino oder der Iceberg REST Catalog API (ListIcebergTableIdentifiers) ansehen.
  • Tabellendetails abrufen:Untersuchen Sie das Tabellenschema, die Eigenschaften und die Anmeldedaten mit der Google Cloud -Konsole, Spark, Trino oder der Iceberg REST Catalog API (GetIcebergTable, LoadIcebergTableCredentials).
  • Daten einfügen:Hängen Sie Datenzeilen mit Spark oder Trino an Ihre Iceberg-Tabellen an.
  • Tabelle abfragen:Führen Sie Abfragen für Ihre Iceberg-Tabellen aus Spark, Trino oder BigQuery mit vierteiliger Tabellenbenennung aus.
  • Tabelle ändern:Tabellenschema weiterentwickeln und Metadateneigenschaften mit der Google Cloud Console, Spark, Trino oder der Iceberg REST Catalog API (UpdateIcebergTable) aktualisieren.
  • Tabelle löschen:Entfernen Sie die Registrierung einer Tabelle aus dem Katalog, ohne die zugrunde liegenden Speicherdateien zu löschen. Verwenden Sie dazu die Google Cloud -Konsole, Spark, Trino oder die Iceberg REST Catalog API (DeleteIcebergTable).

Nächste Schritte