Para escribir desde Dataflow en Apache Iceberg con el catálogo REST de Lakehouse para Apache Iceberg, usa el conector de E/S administrado.
La E/S administrada admite las siguientes capacidades para Apache Iceberg:
| Catálogos |
|
|---|---|
| Capacidades de lectura | Lectura por lotes |
| Capacidades de escritura |
|
Para las tablas de BigQuery para Apache Iceberg,
usa el
BigQueryIO conector
con la API de BigQuery Storage. La tabla ya debe existir; no se admite la creación de tablas dinámicas.
Requisitos previos
Configura Lakehouse para Apache Iceberg. Configura tu Google Cloud proyecto con los permisos necesarios siguiendo Usa el catálogo de tiempo de ejecución de Lakehouse con el catálogo REST de Iceberg. Asegúrate de comprender las limitaciones del catálogo REST de Lakehouse para Apache Iceberg que se describen en esa página.
Dependencias
Agrega las siguientes dependencias a tu proyecto:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.iceberg</groupId>
<artifactId>iceberg-gcp</artifactId>
<version>${iceberg.version}</version>
</dependency>
Ejemplo
En el siguiente ejemplo, se muestra una canalización de transmisión que escribe datos en una tabla de Apache Iceberg con el catálogo REST, respaldado por el catálogo de tiempo de ejecución de Lakehouse.
Java
Para autenticarte en Dataflow, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
¿Qué sigue?
- Lectura de CDC desde Apache Iceberg con el catálogo REST de Lakehouse para Apache Iceberg.
- Obtén más información sobre la E/S administrada.
- Obtén más información sobre el catálogo REST de Lakehouse para Apache Iceberg.