IBM Db2 HADR 用に Pacemaker 対応のスナップショットを構成する

バックアップと DR サービスは、IBM Db2 高可用性障害復旧(HADR)データベース用の Pacemaker 対応のスナップショット機能を提供します。この機能を使用すると、Pacemaker クラスタが管理するスタンバイ データベースの Persistent Disk スナップショットを安全に作成できます。

このプロセスにより、スナップショット作成中のデータベースの一時的な無効化が Pacemaker によって障害と誤解されるのを防ぐことができます。誤解釈を回避することで、不要なデータベースの再起動を防ぐことができます。

始める前に

すべての Db2 HADR スタンバイ ノードで sudo 権限を使用して Pacemaker コマンドを実行するために必要な権限を、Db2 インスタンスの OS ユーザーに付与します。

  1. root ユーザーとして、/etc/sudoers.d/db2_pacemaker_access ファイルを編集用に開きます。

    visudo -f /etc/sudoers.d/db2_pacemaker_access
    
  2. 次の行をファイルに追加します。

    DB2_INSTANCE_OS_USER  ALL=(root)    NOPASSWD: /usr/sbin/pcs status, /usr/sbin/pcs resource * DB2_HADR_PACEMAKER_RESOURCE_REGEX
    
  3. 各プレースホルダを次のように置き換えます。

    • DB2_INSTANCE_OS_USER: Db2 インスタンスの OS ユーザー名。
    • DB2_HADR_PACEMAKER_RESOURCE_REGEX: Db2 HADR Pacemaker リソース名と一致する正規表現。例: *_db2

Pacemaker 対応のバックアップを有効にする

この機能を有効にするには、Db2 アプリケーションのバックアップ設定で Pacemaker リソース名を指定します。

  1. バックアップと DR の管理コンソールで、Db2 アプリケーションのバックアップ設定に移動します。
  2. [Db2 HADR CLUSTER PACEMAKER RESOURCE] オプションを見つけます。
  3. HADR クラスタを管理する Db2 インスタンスの Pacemaker リソース名を入力します。

Pacemaker 対応スナップショットの仕組み

Pacemaker 対応のバックアップ プロセスは、特定の操作シーケンスを通じて Pacemaker と Db2 を調整します。

  1. スクリプトは、スタンバイ ノードにあり、HADR ペアが正常な状態であることを確認する事前チェックを実行します。
  2. このスクリプトは、Db2 インスタンス リソースを Pacemaker のメンテナンス モードにします。このアクションは、リソースのモニタリングを停止するように Pacemaker に指示します。
  3. スクリプトは、db2 deactivate コマンドを使用してデータベースを非アクティブ化し、データベース I/O をフリーズします。
  4. スクリプトは Persistent Disk ストレージのスナップショットを取得します。
  5. スクリプトは、db2 activate コマンドでデータベースを有効にして、I/O のフリーズを解除します。
  6. このスクリプトは、Db2 インスタンス リソースをメンテナンス モードから削除し、Pacemaker がモニタリングを再開できるようにします。
  7. スクリプトはすべてのアクションをログに記録し、クリーンアップ ルーティンを実行します。

トラブルシューティング

バックアップ ジョブが失敗した場合は、データベース スタンバイ ノードで次のログを調べて詳細を確認します。

  • /var/act/log/customapp-db2instance.log: スタンバイ データベースの無効化と有効化、Pacemaker リソースのメンテナンス モードの開始と終了に関する情報が含まれます。
  • /act/tmpdata/BACKUP_JOB_NAME/pcs_background_cleanup.log: スナップショットが 2 分のタイムアウトを超えたため、Pacemaker リソースがメンテナンス モードから自動的に解除されたかどうかを示します。
  • /var/log/pacemaker/pacemaker.log: Pacemaker から追加のコンテキストを提供します。

スナップショットのタイムアウト

Persistent Disk スナップショット ジョブが 2 分を超えると、Backup and DR は Pacemaker リソース メンテナンス モードを自動的に終了します。バックアップ ジョブのステータスが Retrying に変わり、スケジューラが 10 分後に新しいバックアップを開始します。

中止またはブロックされたバックアップ ジョブ

バックアップ ジョブが中止またはブロックされると、システムは 2 分後に Pacemaker リソース メンテナンス モードを終了し、バックアップ ジョブは失敗します。

アラートの設定

バックアップ ジョブが失敗したときにメールを送信するように、Backup and DR 管理コンソールからアラートを構成できます。pcs status に基づいて Pacemaker アラートを構成することもおすすめします。

次のステップ