Questa pagina descrive come configurare Datastream per la replica nelle tabelle BigLake Iceberg in BigQuery.
Le tabelle BigLake Iceberg offrono la stessa esperienza completamente gestita delle tabelle BigQuery standard, ma archiviano i dati nei bucket Cloud Storage di proprietà del cliente nel formato di tabella Apache Iceberg e nel formato di file Parquet. Puoi interrogare e analizzare i dati utilizzando le funzionalità di BigQuery mantenendo i dati nei tuoi bucket di archiviazione.
Configura lo streaming nelle tabelle BigLake Iceberg
Per configurare lo stream in modo che importi i dati nelle tabelle BigLake Iceberg:
- Crea un bucket Cloud Storage in cui vuoi archiviare i dati.
- Crea una connessione alle risorse Cloud in BigQuery. Per informazioni su come creare questo tipo di connessione, vedi Crea e configura una connessione a una risorsa Cloud.
Ottieni l'identificatore del service account di connessione:
bq show --location=LOCATION --connection --project_id=PROJECT_ID CONNECTION_NAMEConcedi l'accesso alla connessione di risorsa Cloud al bucket Cloud Storage che hai creato. Per farlo, aggiungi l'autorizzazione IAM
storage.adminal service account di connessione:gcloud storage buckets add-iam-policy-binding gs://YOUR_GCS_BUCKET \ --member=serviceAccount:YOUR_SERVICE_ACCOUNT_ID \ --role=roles/storage.adminCrea uno stream di tabelle BigLake Iceberg.
Per informazioni su come creare uno stream di tabelle BigLake Iceberg utilizzando la console Google Cloud , consulta Creare uno stream.
Per informazioni su come creare una richiesta per trasmettere dati in streaming alle tabelle BigLake Iceberg utilizzando REST,
Google Cloud CLIo Terraform, consulta Gestire i flussi utilizzando l'API.
Passaggi successivi
- Per saperne di più sugli stream, consulta Ciclo di vita dello stream.
- Per scoprire come creare uno stream, consulta Creare uno stream.
- Per scoprire come creare un profilo di connessione da utilizzare con un flusso di tabelle BigLake Iceberg, consulta Creare un profilo di connessione per BigQuery.