Transmite datos desde fuentes de Spanner

En esta página, se incluye la siguiente información:

  • El comportamiento de Datastream cuando controla los datos que se extraen de una base de datos de Spanner de origen
  • Las ediciones de bases de datos de Spanner que admite Datastream
  • Las limitaciones conocidas para usar una base de datos de Spanner como origen

Comportamiento

Spanner es un servicio de base de datos completamente administrado, escalable y de alta disponibilidad que puedes usar como origen con Datastream. Datastream usa un flujo de cambios de Spanner para hacer un seguimiento de los cambios realizados en las bases de datos de Spanner. Luego, los cambios incluidos en el flujo de cambios se replican en el destino para reproducir los eventos de origen.

Datastream no crea ni modifica flujos de cambios, por lo que los objetos de base de datos que no se rastrean con el flujo de cambios de Spanner proporcionado no se pueden incluir en tu flujo de Datastream.

Para obtener más información sobre Spanner, consulta la documentación de Spanner.

Versiones

Datastream admite todas las ediciones de Spanner disponibles:

  • Edición Standard
  • Edición Enterprise
  • Edición Enterprise Plus

Para obtener una descripción general de cada versión, consulta Descripción general de las ediciones de Spanner.

Nivel gratuito

Datastream te permite transmitir datos de Spanner a BigQuery con el nivel gratuito, que proporciona hasta 100 GiB de datos de captura de datos modificados sin cargo por mes. Para obtener más información, consulta Precios de Datastream.

Limitaciones conocidas

Las limitaciones conocidas para usar una base de datos de Spanner como origen incluyen lo siguiente:

  • Solo se admiten flujos de cambios que usan el tipo de captura de valores NEW_ROW.
  • Datastream no admite las columnas de tipo de datos PROTO ni ENUM.
  • Datastream no admite arrays de tipos de datos DATE ni TIMESTAMP.
  • Las cargas iniciales para bases de datos de más de 3 tebibytes (TiB) pueden tardar más de 24 horas en completarse.
  • Las cargas iniciales crean épocas de instantáneas, un tipo de copia de seguridad creada para una marca de tiempo específica que conserva las versiones de datos para esa marca de tiempo. Las épocas de instantáneas retrasan las compactaciones principales hasta que se completa la carga inicial. Para obtener más información sobre las compactaciones, consulta Descripción general del motor columnar de Spanner.
  • Datastream podría tener problemas para mantenerse al día con los flujos de cambios de Spanner que tienen más de 10,000 particiones. Esto significa que los eventos de cambio podrían llegar con retraso o que el flujo podría fallar.
  • Datastream podría tener problemas para mantenerse al día con los flujos de cambios de Spanner con más de 60,000 actualizaciones por segundo. Esto significa que los eventos de cambio podrían llegar con retraso o que el flujo podría fallar.
  • Datastream podría tener problemas para mantenerse al día con los flujos de cambios de Spanner con un rendimiento de más de 60 mebibytes (MiB) por segundo. Esto significa que los eventos de cambio podrían llegar con retraso o que el flujo podría fallar.
  • No se admite la replicación de datos con partición geográfica porque los flujos de cambios de Spanner no admiten datos particionados.

¿Qué sigue?