Controles de simultaneidad de la transmisión

En esta página, se proporciona una descripción general de los controles de simultaneidad de transmisión, como la cantidad máxima de tareas simultáneas de captura de datos de cambio (CDC) y de relleno. Puedes controlar el rendimiento de la transmisión aumentando o disminuyendo los valores de estos parámetros.

Descripción general de los controles de simultaneidad

Con los controles de simultaneidad, puedes lograr un reabastecimiento y un CDC más rápidos, o bien equilibrar la carga en la base de datos de origen. Si necesitas un mayor rendimiento y puedes permitir una mayor carga en la base de datos, puedes aumentar la simultaneidad de las tareas de CDC y de relleno. Por el contrario, si tu base de datos experimenta una carga alta y deseas protegerla de una sobrecarga, puedes reducir los valores de estos parámetros.

Cantidad máxima de tareas de CDC

El parámetro maxConcurrentCdcTasks te permite controlar la cantidad de tareas de CDC que ejecuta una transmisión en paralelo. Para extender el rendimiento de CDC, aumenta el valor de este parámetro y permite que Datastream procese más archivos de registro de CDC al mismo tiempo.

Las características clave del parámetro incluyen las siguientes:

  • El valor predeterminado es 5. Puedes establecer este parámetro en cualquier valor entre 1 y 50, inclusive.
  • El parámetro solo se aplica a las fuentes de Oracle y MySQL.
  • El parámetro solo tiene impacto si hay más archivos de registro de la base de datos disponibles para leer que tareas de CDC. La configuración de los archivos de registro se controla con los parámetros de configuración de la base de datos de origen: el tamaño máximo del archivo de registro y el intervalo de tiempo máximo de rotación del registro. Para obtener más información sobre estos parámetros, consulta la documentación de Oracle y MySQL.
  • Si disminuyes la cantidad de tareas de CDC simultáneas, es posible que Datastream se retrase con respecto a los registros de la base de datos, lo que podría provocar la pérdida de la posición del registro y la falla de la transmisión.

Cantidad máxima de tareas de reabastecimiento

El parámetro maxConcurrentBackfillTasks te permite controlar la cantidad de tareas de carga inicial que un flujo puede ejecutar en paralelo. Puedes aumentar o disminuir este valor para controlar la capacidad de procesamiento del reabastecimiento.

Las características clave del parámetro incluyen las siguientes:

  • El valor predeterminado es 15. Puedes establecer este parámetro en cualquier valor entre 1 y 50, inclusive.
  • Aumentar la simultaneidad del reabastecimiento conlleva un alto riesgo, ya que las tareas de reabastecimiento tienen un impacto significativo en el rendimiento de la base de datos. Cada tarea de carga inicial ejecuta una consulta SELECT sin filtrar en una tabla y, en el caso de las tablas grandes, estas consultas devuelven una gran cantidad de filas.
  • Si disminuyes la simultaneidad del reabastecimiento, no se generará ningún impacto negativo en la base de datos de origen, excepto que el reabastecimiento tardará más en completarse.

Cómo cambiar los valores de los controles de simultaneidad

Puedes cambiar los valores de los parámetros de control de simultaneidad con la API de Datastream.

¿Qué sigue?