バックアップと DR サービスは、IBM Db2 高可用性障害復旧(HADR)データベース用の Pacemaker 対応のスナップショット機能を提供します。この機能を使用すると、Pacemaker クラスタが管理するスタンバイ データベースの Persistent Disk スナップショットを安全に作成できます。
このプロセスにより、スナップショット作成中のデータベースの一時的な無効化が Pacemaker によって障害と誤解されるのを防ぐことができます。誤解釈を回避することで、不要なデータベースの再起動を防ぐことができます。
始める前に
すべての Db2 HADR スタンバイ ノードで sudo
権限を使用して Pacemaker コマンドを実行するために必要な権限を、Db2 インスタンスの OS ユーザーに付与します。
root
ユーザーとして、/etc/sudoers.d/db2_pacemaker_access
ファイルを編集用に開きます。visudo -f /etc/sudoers.d/db2_pacemaker_access
次の行をファイルに追加します。
DB2_INSTANCE_OS_USER ALL=(root) NOPASSWD: /usr/sbin/pcs status, /usr/sbin/pcs resource * DB2_HADR_PACEMAKER_RESOURCE_REGEX
各プレースホルダを次のように置き換えます。
DB2_INSTANCE_OS_USER
: Db2 インスタンスの OS ユーザー名。DB2_HADR_PACEMAKER_RESOURCE_REGEX
: Db2 HADR Pacemaker リソース名と一致する正規表現。例:*_db2
Pacemaker 対応のバックアップを有効にする
この機能を有効にするには、Db2 アプリケーションのバックアップ設定で Pacemaker リソース名を指定します。
- バックアップと DR の管理コンソールで、Db2 アプリケーションのバックアップ設定に移動します。
- [Db2 HADR CLUSTER PACEMAKER RESOURCE] オプションを見つけます。
- HADR クラスタを管理する Db2 インスタンスの Pacemaker リソース名を入力します。
Pacemaker 対応スナップショットの仕組み
Pacemaker 対応のバックアップ プロセスは、特定の操作シーケンスを通じて Pacemaker と Db2 を調整します。
- スクリプトは、スタンバイ ノードにあり、HADR ペアが正常な状態であることを確認する事前チェックを実行します。
- このスクリプトは、Db2 インスタンス リソースを Pacemaker のメンテナンス モードにします。このアクションは、リソースのモニタリングを停止するように Pacemaker に指示します。
- スクリプトは、
db2 deactivate
コマンドを使用してデータベースを非アクティブ化し、データベース I/O をフリーズします。 - スクリプトは Persistent Disk ストレージのスナップショットを取得します。
- スクリプトは、
db2 activate
コマンドでデータベースを有効にして、I/O のフリーズを解除します。 - このスクリプトは、Db2 インスタンス リソースをメンテナンス モードから削除し、Pacemaker がモニタリングを再開できるようにします。
- スクリプトはすべてのアクションをログに記録し、クリーンアップ ルーティンを実行します。
トラブルシューティング
バックアップ ジョブが失敗した場合は、データベース スタンバイ ノードで次のログを調べて詳細を確認します。
/var/act/log/customapp-db2instance.log
: スタンバイ データベースの無効化と有効化、Pacemaker リソースのメンテナンス モードの開始と終了に関する情報が含まれます。/act/tmpdata/BACKUP_JOB_NAME/pcs_background_cleanup.log
: スナップショットが 2 分のタイムアウトを超えたため、Pacemaker リソースがメンテナンス モードから自動的に解除されたかどうかを示します。/var/log/pacemaker/pacemaker.log
: Pacemaker から追加のコンテキストを提供します。
スナップショットのタイムアウト
Persistent Disk スナップショット ジョブが 2 分を超えると、Backup and DR は Pacemaker リソース メンテナンス モードを自動的に終了します。バックアップ ジョブのステータスが Retrying
に変わり、スケジューラが 10 分後に新しいバックアップを開始します。
中止またはブロックされたバックアップ ジョブ
バックアップ ジョブが中止またはブロックされると、システムは 2 分後に Pacemaker リソース メンテナンス モードを終了し、バックアップ ジョブは失敗します。
アラートの設定
バックアップ ジョブが失敗したときにメールを送信するように、Backup and DR 管理コンソールからアラートを構成できます。pcs status
に基づいて Pacemaker アラートを構成することもおすすめします。
次のステップ
- Backup and DR のコンセプトの詳細を確認する。
- IBM Db2 データベースのバックアップと DR の詳細を確認する。