Per scrivere da Dataflow ad Apache Iceberg, utilizza il connettore I/O gestito.
L'I/O gestito supporta le seguenti funzionalità per Apache Iceberg:
| Cataloghi |
|
|---|---|
| Funzionalità di lettura | Lettura batch |
| Funzionalità di scrittura |
|
Per le tabelle BigQuery per Apache Iceberg,
utilizza il
BigQueryIO connettore
con l'API BigQuery Storage. La tabella deve già esistere; la creazione di tabelle dinamiche non è supportata.
Dipendenze
Aggiungi le seguenti dipendenze al tuo progetto:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
Destinazioni dinamiche
L'I/O gestito per Apache Iceberg supporta le destinazioni dinamiche. Anziché scrivere in una singola tabella fissa, il connettore può selezionare dinamicamente una tabella di destinazione in base ai valori dei campi all'interno dei record in entrata.
Per utilizzare le destinazioni dinamiche, fornisci un modello per il parametro di configurazione table. Per ulteriori informazioni, consulta
Destinazioni dinamiche.
Esempi
Gli esempi seguenti mostrano come utilizzare l'I/O gestito per scrivere in Apache Iceberg.
Scrivere in una tabella Apache Iceberg
L'esempio seguente scrive i dati JSON in memoria in una tabella Apache Iceberg.
Java
Per eseguire l'autenticazione in Dataflow, configura le credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Scrivere con destinazioni dinamiche
L'esempio seguente scrive in tabelle Apache Iceberg diverse in base a un campo nei dati di input.
Java
Per eseguire l'autenticazione in Dataflow, configura le credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Passaggi successivi
- Leggi da Apache Iceberg.
- Scrivi in streaming in Apache Iceberg con il catalogo REST di Lakehouse for Apache Iceberg.
- Scopri di più sull'I/O gestito.