Crea una transmisión de AlloyDB con el flujo automatizado

En esta página, se describe cómo crear una transmisión de AlloyDB para PostgreSQL con el flujo de configuración automatizado.

La configuración de transmisión automatizada simplifica el proceso de traslado de datos de clústeres de AlloyDB para PostgreSQL a BigQuery, ya que reduce la cantidad de pasos que debes realizar. El flujo te permite crear una transmisión directamente desde la página de descripción general de tu clúster de AlloyDB para PostgreSQL.

Una implementación de AlloyDB para PostgreSQL consta de un clúster principal, que contiene una instancia principal. También puede incluir clústeres secundarios y instancias secundarias. Datastream siempre crea la transmisión desde la instancia principal en el clúster principal.

Datastream automatiza la protección de la conexión de VPC entre la transmisión y el clúster de origen, y crea configuraciones de base de datos y recursos de conexión de transmisión.

Antes de comenzar

  1. Habilita las APIs de Datastream, Conectividad de red y Compute Engine.
  2. Asegúrate de tener los permisos necesarios de Identity and Access Management (IAM) para crear y administrar recursos de Datastream. Consulta la sección que sigue para obtener más detalles.
  3. Crea y configura un clúster de AlloyDB para PostgreSQL de origen para la replicación. Para obtener más información, consulta Configura una base de datos de AlloyDB para PostgreSQL para CDC.
  4. Te recomendamos que habilites la replicación lógica para tu clúster antes de crear la transmisión. Si no habilitas la replicación lógica, Datastream la habilita por ti, lo que reinicia tu instancia de origen.

    Para obtener información sobre cómo habilitar la replicación lógica para un clúster de AlloyDB para PostgreSQL, consulta Configura una base de datos de AlloyDB para PostgreSQL para CDC.

  5. Asegúrate de que tu clúster de origen esté configurado para usar el acceso privado a servicios.

Permisos necesarios

Para usar el flujo de creación de transmisión automatizado, necesitas los siguientes roles o permisos de Identity and Access Management (IAM):

  • serviceusage.services.enabley compute.networkAdmin para habilitar las APIs necesarias y realizar tareas de configuración de red
  • alloydb.admin para tareas de configuración de clústeres y de instancias
  • datastream.admin para tareas de administración que Datastream realiza en tu nombre

Si eliges personalizar la configuración de la transmisión, tu usuario administrador de la base de datos también necesita permisos GRANT para el esquema que deseas replicar y algunos permisos adicionales para tareas administrativas y estructurales dentro de la base de datos de origen. Conéctate a tu base de datos de origen y ejecuta lo siguiente:

  GRANT alloydbsuperuser TO "USER_NAME";
  ALTER ROLE "USER_NAME" CREATEROLE;
  GRANT SELECT on ALL TABLES IN SCHEMA "SCHEMA_NAME" to "USER_NAME" WITH GRANT OPTION;
  ALTER DEFAULT PRIVILEGES
  IN SCHEMA "SCHEMA_NAME"
  GRANT SELECT ON TABLES TO "USER_NAME" WITH GRANT OPTION;
  GRANT CREATE ON DATABASE "DATABASE_NAME" TO "USER_NAME";
  

Tablas futuras

Las tablas futuras se agregan automáticamente a la transmisión solo si las crea el usuario cuyos detalles de la cuenta proporcionas para autenticar durante el flujo automatizado. Si otro usuario crea una tabla futura, ese usuario debe otorgar explícitamente el permiso SELECT al usuario lector de Datastream en la tabla.

Crea e inicia la transmisión

Para crear e iniciar una transmisión, sigue estos pasos:

Console

  1. Ve a la página de descripción general de tus clústeres de AlloyDB para PostgreSQL de origen.

    Ir a AlloyDB para PostgreSQL

  2. Haz clic en el clúster principal desde el que deseas transmitir datos.

  3. Crea e inicia tu transmisión automáticamente de una de las siguientes maneras:

    1. En la página Detalles del clúster, en Replicación de datos, haz clic en Iniciar transmisión.
    2. En la sección Integraciones, haz clic en Iniciar transmisión en Replicar datos en BigQuery.
    3. En la pestaña Launchpad, en Integra sin problemas con otros Google Cloud productos, haz clic en Replicar datos en BigQuery.
  4. Se abre el panel Iniciar transmisión para replicar datos.

  5. En Configuración de la transmisión, revisa la configuración predeterminada de la transmisión que creas.

  6. Para cambiar la base de datos de origen, expande el menú desplegable correspondiente y selecciona un valor diferente.

  7. Si estás listo para crear e iniciar tu transmisión, haz clic en Iniciar transmisión.

Si necesitas cambiar la configuración de la transmisión, haz clic en Personalizar.

Personalizar la configuración de la transmisión

Cuando haces clic en Personalizar, aparece la página Personalizar la configuración de la transmisión. Asegúrate de tener los permisos necesarios para personalizar la configuración de la transmisión.

Comenzar

  1. En la página Comenzar, proporciona el nombre de tu transmisión en el campo Nombre de la transmisión. El campo ID de la transmisión se propaga automáticamente.
  2. En la sección Proporciona los detalles de la cuenta de usuario de la instancia, selecciona el método de autenticación:

    • Autenticación de la base de datos de IAM: Esta opción está disponible si tu usuario tiene asignada la identidad principal de Identity and Access Management (IAM) . Para obtener más información, consulta Principales de IAM. Si seleccionas esta opción, debes otorgar manualmente el rol alloydbsuperuser y el permiso CREATEROLE a tu usuario:

      1. En Google Cloud la consola, ve a la página de Clústeres de AlloyDB para PostgreSQL.

      Ir a AlloyDB para PostgreSQL

      1. Selecciona tu clúster de AlloyDB para PostgreSQL.
      2. En el menú de navegación, haz clic en AlloyDB para PostgreSQL Studio y accede.
      3. En el panel Explorador, ejecuta la siguiente consulta para tu usuario:
    GRANT alloydbsuperuser TO "USER_NAME";
    ALTER ROLE "USER_NAME" CREATEROLE;
    • Autenticación integrada de la base de datos: Proporciona el nombre de usuario y la contraseña de un usuario con el rol alloydbsuperuser. Si tu usuario no tiene el rol alloydbsuperuser, sigue los pasos que se describen en la sección Autenticación de la base de datos de IAM para otorgarlo de forma manual. Si seleccionas la autenticación integrada de la base de datos, también asegúrate de que el usuario tenga permisos GRANT en las tablas que desea replicar.
  3. Revisa los detalles adicionales de la transmisión, como la región, el encriptado y las etiquetas. Expande la sección Detalles adicionales de la transmisión para aplicar cambios, si es necesario.

  4. Haz clic en Continuar.

Configura la fuente

  1. En la página Configura la fuente, selecciona la base de datos desde la que deseas replicar datos.

  2. La lista Objetos seleccionados selecciona todos los objetos disponibles de forma predeterminada. Los objetos de la lista son aquellos para los que tienes los permisos necesarios para transmitir. Para cambiar los objetos seleccionados, modifica las selecciones en la lista.

  3. Revisa las configuraciones avanzadas de la transmisión, como el modo de reabastecimiento y la cantidad máxima de conexiones de reabastecimiento simultáneas. Expande la sección Configuraciones avanzadas de la transmisión para aplicar cambios, si es necesario.

  4. Haz clic en Continuar.

Configura el destino

  1. En la página Configura el destino, ajusta la configuración de destino de BigQuery, si es necesario. Para obtener más información, consulta Configura la información sobre el destino de la transmisión.

Crea e inicia la transmisión

  1. Haz clic en Crear e iniciar para crear e iniciar tu transmisión, o en Crear sin iniciar para crear tu transmisión y, luego, iniciarla en Datastream.

  2. Recibirás una notificación sobre las tareas que se realizan automáticamente por ti:

    • Datastream crea los recursos necesarios de la nube privada virtual, como un rango de direcciones IP internas, una subred y una conexión de red.
    • Datastream configura tablas para CDC, configura ranuras de replicación, configura una publicación para todas las tablas de la base de datos y crea un usuario de Datastream dedicado.
    • Datastream crea una configuración de conectividad privada y perfiles de conexión de origen y destino.
  3. Confirma que deseas crear e iniciar tu transmisión.

Supervisa la transmisión

Puedes supervisar los detalles básicos de la transmisión desde la página de descripción general de tu instancia de origen en la Google Cloud consola. En la página, se muestra información como el estado de la transmisión, el nombre de la transmisión, el conjunto de datos de BigQuery de destino y el identificador del proyecto de destino.

Desde la página de descripción general, también puedes realizar acciones como iniciar o pausar la transmisión. Para obtener información de supervisión más detallada, haz clic en el nombre de la transmisión para navegar a Datastream.

Borra la transmisión

Cuando borras una transmisión que creaste con el flujo automatizado, algunos recursos, como la ranura de replicación de PostgreSQL, se borran automáticamente. Sin embargo, hay recursos que debes borrar de forma manual:

  • La publicación. La publicación se crea con el usuario administrador de la base de datos y solo su propietario puede borrarla, por lo que, de forma predeterminada, el usuario que la creó.
  • El usuario lector de Datastream.
  • Los perfiles de conexión de origen y destino de Datastream
  • Los recursos de conectividad privada.
  • Todos los recursos de red creados durante el flujo automatizado, como la subred y la conexión de red.

¿Qué sigue?