En esta página, se describe cómo configurar la captura de datos modificados (CDC) para transmitir datos desde una base de datos de Spanner a un destino compatible, como BigQuery o Cloud Storage.
Antes de comenzar
Si tu instancia de Spanner existe en un proyecto Google Cloud que no sea en el que se ejecuta Datastream, debes proporcionar al agente de servicio de Datastream el rol de IAMspanner.databaseReadery, si planeas usar Data Boost, el rolspanner.databaseReaderWithDataBoost.
Si prefieres usar un rol de base de datos de control de acceso detallado, consulta Crea un perfil de conexión y una transmisión de Spanner para conocer los permisos individuales necesarios.
Crear una base de datos de Spanner
Para comenzar a replicar datos de cambios de Spanner, primero debes crear una instancia de Spanner y una base de datos de Spanner.
Crear transmisión de cambios
Spanner usa flujos de cambios para hacer un seguimiento de los cambios en los datos y transmitirlos, como inserciones, actualizaciones y eliminaciones. Para configurar tu fuente de Spanner para la replicación en Datastream, debes crear y configurar un flujo de cambios de Spanner. Debes especificar el NEW_ROW tipo de captura de valor para tu flujo de cambios.
Para obtener más información, consulta la Descripción general de los flujos de cambios.
Crea un perfil de conexión y una transmisión de Spanner
Cuando creas un perfil de conexión de Spanner nuevo, debes especificar la base de datos de Spanner que creaste. El nombre de la base de datos debe tener el siguiente formato:
projects/PROJECT_ID/instances/INSTANCE/databases/DATABASE_ID
Cuando creas una transmisión, puedes proporcionar de forma opcional lo siguiente:
- Objetos que se incluirán y excluirán.
- Es la cantidad máxima de lecturas simultáneas para las consultas de carga inicial o de flujo de cambios.
- Indica si Datastream debe usar Data Boost cuando consulta Spanner.
Es un rol de base de datos de control de acceso detallado que Datastream usa cuando consulta Spanner. El rol de la base de datos debe tener los siguientes permisos como mínimo:
spanner.sessions.createspanner.sessions.deletespanner.sessions.getspanner.databases.readspanner.databases.selectspanner.databases.partitionQueryspanner.databases.partitionReadspanner.databases.beginReadOnlyTransactionspanner.databases.getDdlspanner.databases.useDataBoost(si eliges usar Data Boost de Spanner)spanner.databases.useRoleBasedAccess
Es la prioridad de la llamada de procedimiento remoto (RPC) de Spanner que Datastream debe usar.
¿Qué sigue?
- Obtén más información sobre Spanner como fuente.