שכפול נתונים בין AlloyDB Omni לבין מסדי נתונים אחרים

בחירת גרסה של מאמר העזרה:

בדף הזה מוסבר איך לשכפל נתונים בין AlloyDB Omni לבין מסדי נתונים אחרים באמצעות התוסף pglogical.

מידע נוסף זמין במאמרים מידע על התוסף pglogical וpglogical: מינוח ורכיבים בסיסיים.

שיטות אימות נתמכות

שתי שיטות האימות העיקריות שבהן נעשה שימוש בתוסף pglogical הן סיסמה ושיטות אימות מהימנות.

שיטת האימות המומלצת היא שיטת אימות מהימנה. מידע נוסף זמין במאמר בנושא שיטות אימות נתמכות.

לפני שמתחילים

אפשר להתקין את pglogical כתוסף במסד נתונים נתון.

לפני שמטמיעים את התוסף pglogical ב-AlloyDB Omni, צריך לוודא שאתם עומדים בדרישות המערכת הבאות:

  • גישה לאשכול PostgreSQL שאינו AlloyDB בתור superuser.
  • התוסף pglogical מותקן באשכול שאינו AlloyDB ל-PostgreSQL. הוראות התקנה ספציפיות לגרסה ולהפצה מופיעות במאמר בנושא pglogical.
  • שרת AlloyDB Omni מותקן ומוגדר. הוראות להתקנת AlloyDB Omni מופיעות במאמר התקנת AlloyDB Omni.
  • כתובות ה-IP של אשכול PostgreSQL שאינו AlloyDB ושל שרת המארח של AlloyDB Omni.
  • רשת מבוססת ומאובטחת בין אשכול PostgreSQL שאינו AlloyDB לבין שרת המארח של AlloyDB Omni. נדרשת קישוריות TCP ביציאה הרגילה של PostgreSQL,‏ 5432.

שינוי פרמטרים בספק שאינו AlloyDB

  1. מגדירים את הפרמטר wal_level לערך logical, ומצרפים את pglogical לפרמטר shared_preload_libraries בקובץ postgresql.conf. התוסף pglogical דורש קבוצה מינימלית של התאמות פרמטרים באשכול הספק שאינו AlloyDB.

    cp postgresql.conf postgresql.bak
    sed -r -i "s|(\#)?wal_level\s*=.*|wal_level=logical|" postgresql.conf
    sed -r -i "s|(\#)?(shared_preload_libraries\s*=\s*)'(.*)'.*$|\2'\3,pglogical'|" postgresql.conf
    sed -r -i "s|',|'|" postgresql.conf
  2. מוודאים שהפרמטרים מוגדרים בצורה תקינה:

    grep -iE 'wal_level|shared_preload_libraries' postgresql.conf
  3. כדי שהשינויים בפרמטרים ייכנסו לתוקף, צריך להפעיל מחדש את האשכול שאינו AlloyDB.

    יכול להיות שפרמטרים אחרים כבר מוגדרים לערכים מספיקים, או שיהיה צורך להתאים אותם בהתאם להפצה ולגרסה שלכם שאינן AlloyDB.

    בודקים את הפרמטרים הבאים:

    • max_worker_processes: אחד לכל מסד נתונים של ספק ולפחות אחד לכל צומת של מנוי. הערך הסטנדרטי של הפרמטר הזה הוא לפחות 10.
    • max_replication_slots: אחד לכל צומת בצמתים של הספק.
    • max_wal_senders: אחד לכל צומת בצמתים של הספק.
    • track_commit_timestamp: מוגדר כ-on אם נדרש פתרון קונפליקטים בעדכון האחרון או הראשון.
    • listen_addresses: צריך לכלול את כתובת ה-IP של AlloyDB Omni או לציין אותה באמצעות חסימת CIDR.
  4. (אופציונלי) אם הספק שלכם שאינו AlloyDB הוא Amazon RDS או Aurora, צריך להפעיל את התוסף pglogical ולשנות את הפרמטרים הנדרשים באמצעות cluster parameter group שינויים.

    1. בתוך קבוצת פרמטרים קיימת או חדשה של אשכול, מגדירים את הפרמטרים הבאים:

      • rds.logical_replication עד 1
      • max_replication_slots עד 50
      • max_wal_senders עד 50
      • max_worker_processes עד 64
      • shared_preload_libraries עד pg_stat_statements, pglogical
    2. מפעילים מחדש את Amazon RDS או את אשכול Aurora כדי שהשינויים בקבוצת הפרמטרים של האשכול ייכנסו לתוקף.

  5. מוודאים שכל ערכי הפרמטרים רלוונטיים:

    SELECT name, setting
    FROM pg_catalog.pg_settings
     WHERE name IN ('listen_addresses',
                    'wal_level',
                    'shared_preload_libraries',
                    'max_worker_processes',
                    'max_replication_slots',
                    'max_wal_senders',
                    'track_commit_timestamp')
     ORDER BY name;
    

שינויים באימות מבוסס-מארח באשכול ספקי AlloyDB Omni

pglogical יוצר חיבורי TCP מקומיים למסד הנתונים של הספק. לכן, צריך להוסיף את כתובת ה-IP של השרת המארח לקובץ DATA_DIR/pg_hba.conf של AlloyDB Omni, כאשר DATA_DIR הוא הנתיב של מערכת הקבצים לספריית הנתונים – לדוגמה, /home/$USER/alloydb-data.

  1. מוסיפים רשומה של אימות מהימן לשרת המקומי, ספציפית למשתמש חדש של pglogical_replication, לקובץ DATA_DIR/pg_hba.conf.

    בנוסף, צמתי המנויים צריכים להיות מסוגלים לבצע אימות מול צמתי הספק. מוסיפים לקובץ DATA_DIR/pg_hba.conf את כתובת ה-IP של כל צומת של מנוי או את טווח כתובות ה-IP המתאים של בלוק CIDR:

    echo -e "# pglogical entries:
    host all pglogical_replication samehost trust
    host all pglogical_replication SERVER_IP_ADDRESS/32 trust
    " | column -t | sudo tee -a DATA_DIR/pg_hba.conf

    מחליפים את SERVER_IP_ADDRESS בכתובת ה-IP של מופע AlloyDB Omni הראשי שממנו רוצים לשכפל.

  2. בודקים שהערכים נכונים:

    tail -3 DATA_DIR/pg_hba.conf
  3. כדי שהשינויים בפרמטרים ייכנסו לתוקף, צריך להפעיל מחדש את האשכול שאינו AlloyDB.

שינוי פרמטרים באשכול המנויים של AlloyDB Omni

בנוסף, ב-pglogical נדרש לבצע התאמות מינימליות של פרמטרים באשכול המנויים של AlloyDB Omni. צריך לצרף את pglogical לפרמטר shared_preload_libraries בקובץ DATA_DIR/postgresql.conf. אם מסד נתונים כלשהו באשכול פועל כמסד נתונים של ספק, צריך לבצע את שינויי הפרמטרים הנדרשים למסדי נתונים של ספקים.

  1. משנים את הפרמטרים:

    sudo sed -r -i "s|(shared_preload_libraries\s*=\s*)'(.*)'.*$|\1'\2,pglogical'|" DATA_DIR/postgresql.conf
  2. מוודאים שהפרמטר מוגדר בצורה תקינה:

    grep -iE 'shared_preload_libraries' DATA_DIR/postgresql.conf
  3. מפעילים מחדש את AlloyDB Omni כדי שהשינוי בפרמטר ייכנס לתוקף:

    Docker

     docker container restart CONTAINER_NAME

    מחליפים את CONTAINER_NAME בשם שהקציתם לקונטיינר AlloyDB Omni כשהפעלתם אותו.

    Podman

     podman container restart CONTAINER_NAME

    מחליפים את CONTAINER_NAME בשם שהקציתם לקונטיינר AlloyDB Omni כשהפעלתם אותו.

  4. מגדירים את ערכי ברירת המחדל של AlloyDB Omni לפרמטרים אחרים של מסד נתונים של ספק:

    • max_worker_processes: אחד לכל מסד נתונים של ספק ואחד לכל צומת של מנוי.
    • track_commit_timestamp: מוגדר ל-on אם נדרש פתרון של קונפליקט בעקבות העדכון האחרון או הראשון.
  5. מוודאים שכל ערכי הפרמטרים רלוונטיים:

    Docker

    docker exec CONTAINER_NAME psql -h localhost -U postgres -c "
    SELECT name, setting
      FROM pg_catalog.pg_settings
     WHERE name IN ('listen_addresses',
                    'wal_level',
                    'shared_preload_libraries',
                    'max_worker_processes',
                    'max_replication_slots',
                    'max_wal_senders',
                    'track_commit_timestamp')
         ORDER BY name;
    "

    Podman

    podman exec CONTAINER_NAME psql -h localhost -U postgres -c "
    SELECT name, setting
      FROM pg_catalog.pg_settings
     WHERE name IN ('listen_addresses',
                    'wal_level',
                    'shared_preload_libraries',
                    'max_worker_processes',
                    'max_replication_slots',
                    'max_wal_senders',
                    'track_commit_timestamp')
         ORDER BY name;
    "

שינויים באימות מבוסס-מארח באשכול המנויים של AlloyDB Omni

pglogical יוצר חיבורי TCP מקומיים למסד הנתונים של המנוי ב-AlloyDB Omni. לכן, צריך להוסיף את כתובת ה-IP של שרת המארח של המנוי לקובץ DATA_DIR/pg_hba.conf של AlloyDB Omni.

  1. מוסיפים רשומה של אימות מהימן לשרת המקומי, ספציפית למשתמש חדש pglogical_replication, לקובץ DATA_DIR/pg_hba.conf:

    echo -e "# pglogical entries:
    host all pglogical_replication samehost trust
    " | column -t | sudo tee -a DATA_DIR/pg_hba.conf
  2. מוודאים שהערך נכון:

    tail -2 DATA_DIR/pg_hba.conf
  3. מפעילים מחדש את AlloyDB Omni כדי שהשינוי באימות ייכנס לתוקף:

    docker container restart CONTAINER_NAME

יצירת משתמש pglogical באשכול הספק ובאשכול הלקוח

צריך ליצור משתמש חדש גם באשכול של הספק וגם באשכול של המנוי. ב-pglogical נדרש שלמשתמש יהיו גם המאפיינים superuser וגם replication.

  1. באשכול ספק AlloyDB ל-PostgreSQL, יוצרים את תפקיד המשתמש:

    CREATE USER pglogical_replication LOGIN PASSWORD 'secret';
    ALTER USER pglogical_replication WITH replication;
    ALTER USER pglogical_replication WITH superuser;
    
  2. (אופציונלי) אם הספק שלכם שאינו AlloyDB הוא Amazon RDS או Aurora, אתם צריכים להעניק את התפקיד הבא:

    GRANT rds_superuser TO replication_user;
    

הוספת pglogical וצמתים למסד הנתונים של הספק שאינו AlloyDB

  1. נותנים את ההרשאות הנדרשות.

    צריך להתקין את התוסף pglogical בכל מסד נתונים ולהעניק את ההרשאה usage למשתמש במסד הנתונים pglogical.

    לדוגמה, אם מסד הנתונים הוא my_test_db, מריצים את הפקודה הבאה:

    CREATE EXTENSION IF NOT EXISTS pglogical;
    GRANT usage ON SCHEMA pglogical TO pglogical_replication;
    
  2. יוצרים צומת pglogical למסדי הנתונים של הספק. הערך node_name הוא שרירותי, והמחרוזת dsn צריכה להיות חיבור TCP תקין בחזרה לאותו מסד נתונים.

    לדוגמה, כדי להגדיר את מסד הנתונים my_test_db, מריצים את הפקודה הבאה:

    SELECT pglogical.create_node(node_name := 'provider', dsn := 'host=SERVER_IP_ADDRESS port=5432 dbname=my_test_db user=pglogical_replication password=secret');
    

יצירת טבלה והוספה שלה לקבוצת השכפול שמוגדרת כברירת מחדל

יוצרים טבלה ומוסיפים אותה לקבוצת השכפול שמוגדרת כברירת מחדל במסד הנתונים של הספק שאינו AlloyDB.

  1. יוצרים טבלת בדיקה בשם test_table_1 במסד הנתונים של הספק:

    CREATE TABLE test_table_1 (col1 INT PRIMARY KEY);
    INSERT INTO test_table_1 VALUES (1),(2),(3);
    
  2. מוסיפים ידנית את טבלת הבדיקה לקבוצת השכפול שמוגדרת כברירת מחדל. אפשר ליצור קבוצות שכפול מותאמות אישית של pglogical, או להשתמש בקבוצות השכפול שמוגדרות כברירת מחדל. כשיצרתם את התוסף, נוצרו כמה קבוצות שכפול שמוגדרות כברירת מחדל, כמו default,‏ default_insert_only ו-ddl_sql. אפשר להוסיף טבלאות ורצפים לקבוצות השכפול בנפרד, או את כולם בבת אחת לסכימה ספציפית.

    -- Add the specified table to the default replication set:
    SELECT pglogical.replication_set_add_table(set_name := 'default', relation := 'test_table_1', synchronize_data := TRUE);
    
    -- Check which tables have been added to all replication sets:
    SELECT * FROM pglogical.replication_set_table;
    
  3. (אופציונלי) מוסיפים את כל הטבלאות בסכימה שצוינה, כמו public:

    -- Add all "public" schema tables to the default replication set:
    SELECT pglogical.replication_set_add_all_tables('default', ARRAY['public']);
    
    -- Check which tables have been added to all replication sets:
    SELECT * FROM pglogical.replication_set_table;
    
    -- Add all "public" schema sequences to the default replication:
    SELECT pglogical.replication_set_add_all_sequences('default', ARRAY['public']);
    
    -- Check which sequences have been added to all replication sets:
    SELECT * FROM pglogical.replication_set_seq;
    
  4. מסירים את הטבלה מקבוצת השכפול default. אם יש בסכימה טבלאות ללא מפתח ראשי או ללא זהות רפליקה, אפשר לשכפל רק הצהרות של INSERT. אם הוספתם את הטבלאות האלה לסט השכפול default באופן אוטומטי באמצעות הפונקציה replication_set_add_all_tables, אתם צריכים להסיר אותן ידנית מסט השכפול הזה ולהוסיף אותן לסט default_insert_only.

    -- Remove the table from the **default** replication set:
    SELECT pglogical.replication_set_remove_table(set_name := 'default', relation := 'test_table_2');
    
    -- Manually add to the **default_insert_only** replication set:
    SELECT pglogical.replication_set_add_table(set_name := 'default_insert_only', relation := 'test_table_2');
    

    אופציונלי: אם רוצים להוסיף את הטבלאות החדשות שנוצרו לקבוצת השכפול באופן אוטומטי, מוסיפים את הטריגר pglogical_assign_repset כמו שמוצע במקור pglogical.

העתקת מסד הנתונים לאשכול המנויים של AlloyDB Omni

  1. יוצרים גיבוי של מסד הנתונים של המקור שמכיל רק את הסכימה באמצעות כלי השירות pg_dump.

  2. מריצים את הפקודה pg_dump משרת המנוי של AlloyDB Omni באמצעות כתובת ה-IP או נקודת הקצה של השרת שאינו AlloyDB.

    pg_dump -h SERVER_IP_ADDRESS -U postgres --create --schema-only my_test_db > my_test_db.schema-only.sql
  3. מייבאים את הגיבוי למסד הנתונים של המנויים בשרת AlloyDB Omni של המנויים:

    Docker

    docker exec -i CONTAINER_NAME psql -h localhost -U postgres < my_test_db.schema-only.sql

    Podman

    podman exec -i CONTAINER_NAME psql -h localhost -U postgres < my_test_db.schema-only.sql

הפעולה הזו יוצרת את מסד הנתונים ואת הסכימה, בלי נתוני השורות. הנתונים בשורה משוכפלים על ידי התוסף pglogical. מעתיקים או יוצרים מחדש באופן ידני את כל המשתמשים או התפקידים האחרים שנדרשים.

יצירת צומת ומינוי במסד הנתונים של המנוי ב-AlloyDB Omni

  1. יוצרים צומת במסד הנתונים של המנוי ב-AlloyDB Omni. אם בוחרים להשתמש באימות באמצעות סיסמה, צריך להוסיף את הסיסמה ל-dsn.

    Docker

    docker exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT pglogical.create_node(node_name := 'subscriber', dsn := 'host=localhost port=5432 dbname=my_test_db user=pglogical_replication');
    "

    Podman

    podman exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT pglogical.create_node(node_name := 'subscriber', dsn := 'host=localhost port=5432 dbname=my_test_db user=pglogical_replication');
    "
  2. יוצרים מינוי במסד הנתונים של המנוי, שמפנה חזרה למסד הנתונים של הספק בשרת הספק של AlloyDB Omni.

    Docker

    docker exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT pglogical.create_subscription(subscription_name := 'test_sub_1', provider_dsn := 'host=SERVER_IP_ADDRESS port=5432 dbname=my_test_db user=pglogical_replication password=secret');
    "

    Podman

    podman exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT pglogical.create_subscription(subscription_name := 'test_sub_1', provider_dsn := 'host=SERVER_IP_ADDRESS port=5432 dbname=my_test_db user=pglogical_replication password=secret');
    "
  3. תוך כמה שניות או דקות, הנתונים הראשוניים אמורים להיות משוכפלים מהספק למנוי:

    Docker

    docker exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT * FROM test_table_1 ORDER BY 1;
    "

    Podman

    podman exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT * FROM test_table_1 ORDER BY 1;
    "

    גם שורות נוספות שמוסיפים למסד הנתונים של הספק משוכפלות בזמן אמת תוך שניות.

שיקולים נוספים לגבי פריסה של pglogical

לתוסף pglogical יש הרבה תכונות מתקדמות שלא מוסברות במסמך הזה. הרבה מהתכונות האלה רלוונטיות להטמעה שלכם. אפשר להשתמש בתכונות המתקדמות הבאות:

  • יישוב סכסוכים
  • שכפול דו-כיווני ורב-מאסטר
  • הכללה של רצפים
  • הליכים של מעבר לגיבוי (failover) ומעבר חזרה (switchover)

המאמרים הבאים