Configurar snapshots compatíveis com o Pacemaker para o HADR do IBM Db2

O serviço de backup e DR oferece um recurso de snapshot compatível com o Pacemaker para bancos de dados de recuperação de desastres de alta disponibilidade (HADR) do IBM Db2. Use esse recurso para tirar snapshots do Persistent Disk de um banco de dados em espera gerenciado por um cluster do Pacemaker.

Esse processo impede que o Pacemaker interprete erroneamente a desativação temporária do banco de dados durante um snapshot como uma falha. Isso evita uma reinicialização desnecessária do banco de dados.

Antes de começar

Conceda ao usuário do SO da instância do Db2 as permissões necessárias para executar comandos do Pacemaker com privilégios sudo em todos os nós de espera do HADR do Db2.

  1. Como o usuário root, abra o arquivo /etc/sudoers.d/db2_pacemaker_access para edição:

    visudo -f /etc/sudoers.d/db2_pacemaker_access
    
  2. Adicione a linha a seguir ao arquivo:

    DB2_INSTANCE_OS_USER  ALL=(root)    NOPASSWD: /usr/sbin/pcs status, /usr/sbin/pcs resource * DB2_HADR_PACEMAKER_RESOURCE_REGEX
    
  3. Substitua os seguintes marcadores:

    • DB2_INSTANCE_OS_USER: o nome de usuário do SO da instância do Db2.
    • DB2_HADR_PACEMAKER_RESOURCE_REGEX: a expressão regular que corresponde ao nome do recurso do Pacemaker da HADR do Db2. Por exemplo, *_db2.

Ativar backups compatíveis com o Pacemaker

Para ativar esse recurso, especifique o nome do recurso Pacemaker nas configurações de backup do aplicativo Db2.

  1. No console de gerenciamento de backup e DR, acesse as configurações de backup do aplicativo Db2.
  2. Localize a opção RECURSO DO PACEMAKER DO CLUSTER HADR DO DB2.
  3. Insira o nome do recurso do Pacemaker para a instância do Db2 que gerencia o cluster de alta disponibilidade e recuperação de desastres (HADR).

Como os snapshots compatíveis com Pacemaker funcionam

O processo de backup compatível com o Pacemaker coordena o Pacemaker e o Db2 por uma sequência específica de operações.

  1. O script executa pré-verificações para confirmar se ele está no nó de espera e se o par HADR está em um estado íntegro.
  2. O script coloca o recurso de instância do Db2 no modo de manutenção do Pacemaker. Essa ação instrui o Pacemaker a parar de monitorar o recurso.
  3. O script desativa o banco de dados com o comando db2 deactivate para congelar a E/S do banco de dados.
  4. O script cria o snapshot de armazenamento do Persistent Disk.
  5. O script ativa o banco de dados com o comando db2 activate para descongelar a E/S.
  6. O script remove o recurso de instância do Db2 do modo de manutenção, o que permite que o Pacemaker retome o monitoramento.
  7. O script registra todas as ações e executa rotinas de limpeza.

Resolver problemas

Se um job de backup falhar, examine os seguintes registros no nó em espera do banco de dados para mais detalhes:

  • /var/act/log/customapp-db2instance.log: contém informações sobre a desativação e ativação do banco de dados em espera e a entrada e saída do modo de manutenção de recursos do Pacemaker.
  • /act/tmpdata/BACKUP_JOB_NAME/pcs_background_cleanup.log: indica se o recurso do Pacemaker foi automaticamente removido do modo de manutenção porque o snapshot excedeu o tempo limite de dois minutos.
  • /var/log/pacemaker/pacemaker.log: fornece contexto adicional do Pacemaker.

Tempo limite do snapshot

Se um job de snapshot do Persistent Disk exceder dois minutos, o Backup and DR vai sair automaticamente do modo de manutenção de recursos do Pacemaker. O status do job de backup muda para Retrying, e o programador inicia um novo backup em dez minutos.

Jobs de backup bloqueados ou cancelados

Se um job de backup for interrompido ou bloqueado, o sistema vai sair do modo de manutenção de recursos do Pacemaker após dois minutos, e o job de backup vai falhar.

Configurar alertas

É possível configurar alertas no console de gerenciamento de backup e DR para enviar e-mails quando um job de backup falhar. Também é recomendável configurar alertas do Pacemaker com base em pcs status.

A seguir