Lakehouse for Apache Iceberg supporta la creazione, la gestione e l'interrogazione di tabelle del catalogo REST di Lakehouse Iceberg archiviate in Cloud Storage.
Gestite tramite il catalogo runtime Lakehouse, queste tabelle sono leggibili da BigQuery e dai motori open source connessi. Le operazioni di scrittura rimangono limitate al motore specifico che ha creato originariamente la tabella. Oltre alle integrazioni del motore di query, il catalogo del runtime di Lakehouse implementa la specifica dell'API REST Catalog open source Iceberg, consentendo ai client REST compatibili di interagire direttamente con le risorse della tabella.
Prima di iniziare
Consulta la panoramica delle tabelle per comprendere i diversi tipi di tabelle e le implicazioni del loro utilizzo.
-
Verifica che la fatturazione sia attivata per il tuo progetto Google Cloud .
-
Abilita l'API BigLake.
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (
roles/serviceusage.serviceUsageAdmin), che include l'autorizzazioneserviceusage.services.enable. Scopri come concedere i ruoli.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per gestire le tabelle del catalogo REST Iceberg di Lakehouse, chiedi all'amministratore di concederti i seguenti ruoli IAM sul progetto e sul bucket di archiviazione:
-
Creare ed eliminare tabelle:
- BigLake Admin (
roles/biglake.admin) - the project - Amministratore Storage (
roles/storage.admin): il bucket Cloud Storage
- BigLake Admin (
-
Leggi i dati della tabella in modalità di distribuzione delle credenziali:
Visualizzatore BigLake (
roles/biglake.viewer): il progetto -
Scrivi i dati della tabella in modalità di distribuzione delle credenziali:
Editor BigLake (
roles/biglake.editor): il progetto -
Leggi i dati della tabella in modalità di distribuzione delle credenziali non attiva:
- BigLake Viewer (
roles/biglake.viewer) - il progetto - Storage Object Viewer (
roles/storage.objectViewer): il bucket Cloud Storage
- BigLake Viewer (
-
Scrivi i dati della tabella in modalità di distribuzione delle credenziali non automatica:
- BigLake Editor (
roles/biglake.editor) - the project - Storage Object User (
roles/storage.objectUser): il bucket Cloud Storage
- BigLake Editor (
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Azioni di gestione
Puoi eseguire le seguenti azioni di gestione sulle tabelle del catalogo REST Lakehouse Iceberg:
- Crea una tabella: crea una tabella Apache Iceberg all'interno di uno spazio dei nomi del catalogo utilizzando la console Google Cloud , Spark, Trino o l'API REST Catalog di Iceberg (
CreateIcebergTable). - Elenca tabelle: visualizza gli identificatori delle tabelle all'interno di uno spazio dei nomi utilizzando la console Google Cloud , Spark, Trino o l'API Iceberg REST Catalog (
ListIcebergTableIdentifiers). - Visualizza i dettagli della tabella: esamina lo schema, le proprietà e le credenziali della tabella utilizzando la console Google Cloud , Spark, Trino o l'API REST Catalog Iceberg (
GetIcebergTable,LoadIcebergTableCredentials). - Inserisci dati: aggiungi righe di dati alle tabelle Iceberg utilizzando Spark o Trino.
- Esegui query su una tabella: esegui query sulle tabelle Iceberg da Spark, Trino o BigQuery utilizzando la denominazione delle tabelle in quattro parti.
- Modifica di una tabella: fai evolvere lo schema della tabella e aggiorna le proprietà dei metadati utilizzando la console Google Cloud , Spark, Trino o l'API Iceberg REST Catalog (
UpdateIcebergTable). - Elimina una tabella: elimina la registrazione di una tabella dal catalogo senza eliminare i file di archiviazione sottostanti utilizzando la console Google Cloud , Spark, Trino o l'API REST Catalog Iceberg (
DeleteIcebergTable).
Passaggi successivi
- Consulta il catalogo REST di Apache Iceberg.