Configura instantáneas compatibles con Pacemaker para HADR de IBM Db2

El servicio Backup and DR proporciona una función de instantáneas compatible con Pacemaker para las bases de datos de recuperación ante desastres de alta disponibilidad (HADR) de IBM Db2. Usa esta función para tomar instantáneas de forma segura de Persistent Disk de una base de datos en espera que administra un clúster de Pacemaker.

Este proceso evita que Pacemaker interprete erróneamente la desactivación temporal de la base de datos durante una instantánea como una falla. Evitar una interpretación errónea impide un reinicio innecesario de la base de datos.

Antes de comenzar

Otorga al usuario del SO de la instancia de Db2 los permisos necesarios para ejecutar comandos de Pacemaker con privilegios de sudo en todos los nodos en espera de HADR de Db2.

  1. Como usuario root, abre el archivo /etc/sudoers.d/db2_pacemaker_access para editarlo:

    visudo -f /etc/sudoers.d/db2_pacemaker_access
    
  2. Agrega la siguiente línea al archivo:

    DB2_INSTANCE_OS_USER  ALL=(root)    NOPASSWD: /usr/sbin/pcs status, /usr/sbin/pcs resource * DB2_HADR_PACEMAKER_RESOURCE_REGEX
    
  3. Reemplaza los siguientes marcadores de posición:

    • DB2_INSTANCE_OS_USER: Es el nombre de usuario del SO de tu instancia de Db2.
    • DB2_HADR_PACEMAKER_RESOURCE_REGEX: Es la expresión regular que coincide con el nombre del recurso de Pacemaker de HADR de Db2. Por ejemplo, *_db2

Habilita las copias de seguridad compatibles con Pacemaker

Para habilitar esta función, especifica el nombre del recurso de Pacemaker en la configuración de copia de seguridad de tu aplicación de Db2.

  1. En la consola de administración de Backup and DR, ve a la configuración de copia de seguridad de la aplicación Db2.
  2. Busca la opción Db2 HADR CLUSTER PACEMAKER RESOURCE.
  3. Ingresa el nombre del recurso de Pacemaker para la instancia de Db2 que administra el clúster de HADR.

Cómo funcionan las instantáneas compatibles con Pacemaker

El proceso de copia de seguridad compatible con Pacemaker coordina Pacemaker y Db2 a través de una secuencia específica de operaciones.

  1. La secuencia de comandos ejecuta verificaciones previas para verificar que se encuentre en el nodo en espera y que el par de HADR esté en buen estado.
  2. La secuencia de comandos coloca el recurso de instancia de Db2 en el modo de mantenimiento de Pacemaker. Esta acción le indica a Pacemaker que deje de supervisar el recurso.
  3. La secuencia de comandos desactiva la base de datos con el comando db2 deactivate para congelar la E/S de la base de datos.
  4. La secuencia de comandos toma la instantánea de almacenamiento de Persistent Disk.
  5. La secuencia de comandos activa la base de datos con el comando db2 activate para descongelar la E/S.
  6. La secuencia de comandos quita el recurso de instancia de Db2 del modo de mantenimiento, lo que permite que Pacemaker reanude la supervisión.
  7. La secuencia de comandos registra todas las acciones y ejecuta rutinas de limpieza.

Solucionar problemas

Si falla un trabajo de copia de seguridad, examina los siguientes registros en el nodo en espera de la base de datos para obtener más detalles:

  • /var/act/log/customapp-db2instance.log: Contiene información sobre la desactivación y activación de la base de datos en espera, y la entrada y salida del modo de mantenimiento de recursos de Pacemaker.
  • /act/tmpdata/BACKUP_JOB_NAME/pcs_background_cleanup.log: Indica si el recurso de Pacemaker se quitó automáticamente del modo de mantenimiento porque la instantánea superó el tiempo de espera de dos minutos.
  • /var/log/pacemaker/pacemaker.log: Proporciona contexto adicional de Pacemaker.

Tiempo de espera de la instantánea

Si un trabajo de instantánea de Persistent Disk supera los dos minutos, Backup and DR sale automáticamente del modo de mantenimiento de recursos de Pacemaker. El estado del trabajo de copia de seguridad cambia a Retrying y el programador inicia una copia de seguridad nueva en diez minutos.

Trabajos de copia de seguridad bloqueados o anulados

Si un trabajo de copia de seguridad se anula o se bloquea, el sistema sale del modo de mantenimiento de recursos de Pacemaker después de dos minutos y el trabajo de copia de seguridad falla.

Configura alertas

Puedes configurar alertas desde la consola de administración de Backup and DR para enviar correos electrónicos cuando falle un trabajo de copia de seguridad. También se recomienda configurar alertas de Pacemaker basadas en pcs status.

¿Qué sigue?