pglogical ולפתור בעיות בהן באמצעות בדיקה ואימות של מסדי הנתונים של הספק והמנוי.
לפני שמתחילים
לפני שמתחילים לעקוב אחרי הטמעות של pglogical ולפתור בעיות שקשורות אליהן, צריך לבדוק את מסדי הנתונים של הספק והמנוי, להבין את ההטמעה של pglogical ולאמת את ההגדרה שלה.
מידע נוסף על התוסף pglogical זמין במאמר מידע על pglogical.
למידע על שכפול נתונים באמצעות pglogical, אפשר לעיין במאמרים שכפול נתונים בין AlloyDB ל-PostgreSQL לבין AlloyDB Omni ושכפול נתונים בין AlloyDB Omni לבין מסדי נתונים אחרים.
בדיקת ההגדרות של pglogical, השכפול והפרמטרים של AlloyDB Omni
מספר פרמטרים של הגדרה משפיעים על הפעולה של התוסף pglogical
ואפשר לבדוק את זה במסדי הנתונים של הספק והמנוי. שימו לב: ערכי הפרמטרים עשויים להשתנות.
הצגת ההגדרה הנוכחית של פרמטרים ספציפיים של
pglogical:SELECT name, setting, source, short_desc FROM pg_catalog.pg_settings WHERE name LIKE '%pglogical%' AND name NOT LIKE '%alloydb%' ORDER BY category, name;הצגת פרמטרים אחרים שקשורים לשכפול לוגי:
SELECT name, setting, source, short_desc FROM pg_catalog.pg_settings WHERE name IN ('wal_level', 'max_worker_processes', 'max_replication_slots', 'max_wal_senders', 'shared_preload_libraries', 'track_commit_timestamp') ORDER BY name;הצגת פרמטרים ספציפיים ל-AlloyDB Omni:
SELECT name, setting, source, short_desc FROM pg_catalog.pg_settings WHERE name LIKE '%alloydb%' ORDER BY category, name;
רשימת הצמתים בהגדרה
מפרטים את הצמתים המקומיים והמרוחקים בהגדרת השכפול
pglogical:SELECT node_id, if_nodeid AS node_id, if_name AS node_name, if_dsn AS dsn FROM pglogical.node_interface LEFT JOIN pglogical.local_node ON (node_id = if_nodeid AND node_local_interface = if_id) ORDER BY node_name;אם העמודה
node_idהיאNOT NULL, זהו הצומת המקומי.בודקים את פרטי
dsnבפירוט. פרטים שגויים או לא מעודכנים של מחרוזת החיבור עלולים לגרום לכשלים בשכפול. מידע על פתרון בעיות ב-dsnזמין במאמר פתרון בעיות בשכפול מינויים.
בדיקת סטטוס המינוי ונקודת הרפליקציה של הטבלה
אתם מאמתים את סטטוס המינוי ממסד הנתונים של המנויים. סטטוס המנוי הוא initializing או replicating. יכול להיות שיוצג גם הסטטוס down. מידע נוסף על הסטטוס down זמין במאמר פתרון בעיות בשכפול מינויים.
רשימת המינויים הנוכחיים של מסד הנתונים, סטטוס המינוי וההגדרות.
SELECT s.sub_name AS subscription_name, n1.node_name AS origin_name, n2.node_name AS target_name, x.status, sub_slot_name, sub_replication_sets, sub_forward_origins, sub_apply_delay, sub_force_text_transfer, sub_enabled AS enabled FROM pglogical.subscription s, (SELECT subscription_name, status FROM pglogical.show_subscription_status()) AS x, pglogical.node n1, pglogical.node n2 WHERE s.sub_origin = n1.node_id AND s.sub_target = n2.node_id AND s.sub_name = x.subscription_name ORDER BY s.sub_name;הפלט אמור להיראות כך:
-[ RECORD 1 ]-----------+-------------------------------------- subscription_id | 3072625608 subscription_name | test_sub_1 origin_name | provider target_name | subscriber status | replicating sub_slot_name | pgl_my_test_db_provider_test_sub_1 sub_replication_sets | {default,default_insert_only,ddl_sql} sub_forward_origins | {all} sub_apply_delay | 00:00:00 sub_force_text_transfer | f enabled | t my_test_db=#צריך לציין את הטבלאות שמשוכפלות כרגע ואת מספר רצף היומן (LSN) הנוכחי שלהן לפי המינוי:
SELECT sync_nspname||'.'||sync_relname AS table_name, sync_status, sync_statuslsn FROM pglogical.local_sync_status WHERE sync_relname IS NOT NULL ORDER BY table_name;הפלט אמור להיראות כך:
table_name | sync_status | sync_statuslsn ---------------------+-------------+---------------- public.test_table_1 | r | 0/B891BC0 (1 row) my_test_db=#בעמודה
sync_statuslsnמוצג מספר ה-LSN שאליו הטבלה מסונכרנת. אפשר להשוות את המספר הזה למספר ה-LSN במסד הנתונים של הספק כדי להעריך את השהיית השכפול.כדי לבדוק את סטטוס הרפליקציה של טבלה ספציפית:
SELECT * FROM pglogical.show_subscription_table('test_sub_1','test_table_1');
אימות הפרטים של קבוצת השכפול אצל הספק
מציגים ברשימה את קבוצות השכפול הנוכחיות במסד הנתונים של הספק ובודקים את הפריטים שמשוכפלים:
SELECT set_name, node_name, replicate_insert, replicate_update, replicate_delete, replicate_truncate FROM pglogical.replication_set JOIN pglogical.node ON set_nodeid = node_id ORDER BY set_name, node_name;רשימת הטבלאות והרצפים שמשוכפלים:
-- Table details: SELECT set_name, set_reloid AS table_name, set_att_list, set_row_filter FROM pglogical.replication_set NATURAL JOIN pglogical.replication_set_table ORDER BY set_name, table_name; -- Sequence details: SELECT set_name, set_seqoid AS sequence_name FROM pglogical.replication_set NATURAL JOIN pglogical.replication_set_seq ORDER BY set_name, sequence_name;
בודקים את פרטי השכפול ואת השהיית המשבצת אצל הספק
כדי לבדוק את הסטטוס של כל מנוי, יוצרים את התצוגה
pg_stat_replicationבמסד הנתונים של הספק:SELECT application_name, state, sync_state, client_addr, client_hostname, pg_wal_lsn_diff(pg_current_wal_lsn(),sent_lsn) AS sent_lag, pg_wal_lsn_diff(sent_lsn,flush_lsn) AS receiving_lag, pg_wal_lsn_diff(flush_lsn,replay_lsn) AS replay_lag, pg_wal_lsn_diff(pg_current_wal_lsn(),replay_lsn) AS total_lag, now()-reply_time AS reply_delay FROM pg_stat_replication ORDER BY client_hostname;הפלט אמור להיראות כך:
-[ RECORD 1 ]----+------------------------------ application_name | test_sub_1 state | streaming sync_state | async client_addr | 10.45.0.80 client_hostname | sent_lag | 0 receiving_lag | 0 replay_lag | 0 total_lag | 0 reply_delay | 00:00:26.203433 my_test_db=#שימו לב לעמודה
reply_delayשבה מוצגת השעה שבה התקבל העדכון האחרון ממסד הנתונים של המנויים.צריך לעקוב אחרי השהיית השכפול של משבצת השכפול אצל הספק, כי
pglogicalיוצר משבצות שכפול במסד הנתונים של הספק:SELECT slot_name, slot_type, database, active, COALESCE(pg_wal_lsn_diff(pg_current_wal_lsn(),restart_lsn),0) AS restart_lag, COALESCE(pg_wal_lsn_diff(pg_current_wal_lsn(),confirmed_flush_lsn),0) AS confirmed_flush_lag FROM pg_replication_slots WHERE plugin like '%pglogical%' ORDER BY slot_name;הפלט אמור להיראות כך:
-[ RECORD 1 ]-------+----------------------------------- slot_name | pgl_my_test_db_provider_test_sub_1 slot_type | logical database | my_test_db active | t restart_lag | 56 confirmed_flush_lag | 0 my_test_db=#
פתרון בעיות בשכפול מינויים
אם המינוי נוצר לאחרונה, סטטוס המינוי שמופיע במסד הנתונים של המנויים חייב להיות replicating או initializing.
אם הסטטוס הוא down, סימן שהתרחשה בעיה.
הסטטוס down מוצג בדרך כלל אחרי שהמערכת ניסתה להתחיל שכפול, אבל הניסיון נכשל. הסיבה לכך היא בעיות בקישוריות שנובעות מההגדרה dsn, או מהרשאות חסרות במסד הנתונים, אצל הספק או המנוי.
כדי לקבל מידע נוסף שיכול להצביע על הגורם לבעיה, אפשר להשתמש ב-Logs Explorer ולבדוק את קובצי היומן של PostgreSQL ב- Google Cloud כש- Google Cloud AlloyDB הוא אחד מנקודות הקצה. קובצי היומן מספקים פרטים על הבעיה, כולל פרטים ספציפיים על הרשאות חסרות.
בודקים את היומן של PostgreSQL בשרת AlloyDB Omni:
sudo journalctl -u alloydbomni18פותרים בעיות בהגדרה
dsnומוודאים שהבעיה לא נובעת מקישוריות לרשת:מעתיקים את מחרוזת החיבור
dsnומנסים להתחבר באופן ידני באמצעותpsqlואותה מחרוזת. אם אי אפשר להתחבר לסשןpsql, זה מצביע על הבעיות הבאות:- בעיה ברשת.
- כתובת IP, שם משתמש או סיסמה שגויים.
- חומת אש חוסמת.
- הקובץ
pg_hba.confשל האשכול השני לא מוגדר כמו שצריך.
אחרי שמבצעים פעולות לתיקון הבעיה, מסנכרנים מחדש את הטבלה או מסירים את המינוי ויוצרים אותו מחדש:
כדי לסנכרן מחדש טבלה בלי להפסיק את המינוי:
SELECT pglogical.alter_subscription_resynchronize_table(subscription_name := 'test_sub_1',relation := 'table_name');אפשרות אחרת היא להפסיק את המינוי וליצור אותו מחדש:
SELECT pglogical.drop_subscription(subscription_name := 'test_sub_1');
המאמרים הבאים
- מעבר לגיבוי (failover) ומעבר חזרה (switchover) עם שכפול
pglogical - שכפול נתונים בין Google Cloud AlloyDB לבין AlloyDB Omni
- שכפול נתונים בין AlloyDB Omni לבין מסדי נתונים אחרים