Para escribir desde Dataflow en Apache Iceberg, usa el conector de E/S gestionado.
La E/gestionada admite las siguientes funciones de Apache Iceberg:
| Catálogos |
|
|---|---|
| Leer funciones | Lectura por lotes |
| Funciones de escritura |
|
En el caso de las tablas de BigQuery para Apache Iceberg,
utiliza el
conector BigQueryIO
con la API Storage de BigQuery. La tabla ya debe existir. No se admite la creación de tablas dinámicas.
Dependencias
Añade las siguientes dependencias a tu proyecto:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
Destinos dinámicos
La E/gestionada de Apache Iceberg admite destinos dinámicos. En lugar de escribir en una sola tabla fija, el conector puede seleccionar dinámicamente una tabla de destino en función de los valores de los campos de los registros entrantes.
Para usar destinos dinámicos, proporciona una plantilla para el parámetro de configuración table. Para obtener más información, consulta Destinos dinámicos.
Ejemplos
En los siguientes ejemplos se muestra cómo usar la E/S gestionada para escribir en Apache Iceberg.
Escribir en una tabla de Apache Iceberg
En el siguiente ejemplo se escriben datos JSON en memoria en una tabla de Apache Iceberg.
Java
Para autenticarte en Dataflow, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Escribir con destinos dinámicos
En el siguiente ejemplo se escribe en diferentes tablas de Apache Iceberg en función de un campo de los datos de entrada.
Java
Para autenticarte en Dataflow, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Siguientes pasos
- Leer de Apache Iceberg
- Escritura de streaming en Apache Iceberg con el catálogo REST de BigLake.
- Consulta más información sobre E/S gestionada.