Per scrivere da Dataflow ad Apache Iceberg utilizzando il catalogo REST Lakehouse for Apache Iceberg, utilizza il connettore I/O gestito.
L'I/O gestito supporta le seguenti funzionalità per Apache Iceberg:
| Cataloghi |
|
|---|---|
| Funzionalità di lettura | Lettura batch |
| Funzionalità di scrittura |
|
Per le tabelle BigQuery per Apache Iceberg,
utilizza il
BigQueryIO connettore
con l'API BigQuery Storage. La tabella deve già esistere; la creazione di tabelle dinamiche non è supportata.
Prerequisiti
Configura Lakehouse for Apache Iceberg. Configura il tuo Google Cloud progetto con le autorizzazioni richieste seguendo le istruzioni riportate in Utilizza il catalogo di runtime Lakehouse con il catalogo REST Iceberg. Assicurati di comprendere le limitazioni del catalogo REST Iceberg di Lakehouse for Apache Iceberg Iceberg descritte in quella pagina.
Dipendenze
Aggiungi le seguenti dipendenze al tuo progetto:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.iceberg</groupId>
<artifactId>iceberg-gcp</artifactId>
<version>${iceberg.version}</version>
</dependency>
Esempio
L'esempio seguente mostra una pipeline di streaming che scrive dati in una tabella Apache Iceberg utilizzando il catalogo REST, supportato dal catalogo di runtime Lakehouse.
Java
Per eseguire l'autenticazione in Dataflow, configura le credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Passaggi successivi
- Lettura CDC da Apache Iceberg con il catalogo REST Lakehouse for Apache Iceberg.
- Scopri di più sull'I/O gestito.
- Scopri di più sul catalogo REST Lakehouse for Apache Iceberg.