בדף הזה מוסבר איך להגדיר לכידת נתונים משתנים (CDC) כדי להזרים נתונים ממסד נתונים של Amazon Aurora PostgreSQL אל יעד נתמך, כמו BigQuery או Cloud Storage.
יצירת קבוצת פרמטרים
- מפעילים את מרכז הבקרה של Amazon RDS.
- בחלונית הניווט, לוחצים על קבוצות פרמטרים ואז על יצירת קבוצת פרמטרים. יופיע הדף Create Parameter Group.
- משתמשים בטבלה הבאה כדי למלא את השדות בדף הזה, ואז לוחצים על יצירה:
שדה תיאור קבוצת פרמטרים משפחתית בוחרים את הקבוצה המשפחתית שתואמת למסד הנתונים שלכם. סוג בוחרים באפשרות DB Cluster Parameter Group (קבוצת פרמטרים של אשכול מסד נתונים). שם הקבוצה נותנים שם לקבוצת הפרמטרים. תיאור מזינים תיאור לקבוצת הפרמטרים. - מסמנים את התיבה שמשמאל לקבוצת הפרמטרים החדשה שיצרתם, ואז בקטע פעולות בקבוצת פרמטרים לוחצים על עריכה.
- משנים את הערך של הפרמטר
rds.logical_replicationל-1. - לוחצים על שמירת השינויים.
הקצאת קבוצת הפרמטרים למופע של מסד הנתונים
- מפעילים את מרכז הבקרה של Amazon RDS.
- בחלונית הניווט, לוחצים על מסדי נתונים ובוחרים את מופע מסד הנתונים.
- בתפריט פעולות על המופע, בוחרים באפשרות שינוי. מופיעה תיבת הדו-שיח Modify DB Instance.
- בקטע Additional configuration (הגדרה נוספת), בוחרים את קבוצת הפרמטרים של אשכול מסד הנתונים שיצרתם.
- מגדירים את תקופת השמירה של הגיבוי ל-7 ימים.
- לוחצים על Continue.
- בחלונית Scheduling of modifications, בוחרים באפשרות Apply immediately.
מבצעים אתחול מחדש של מופע מסד הנתונים
- מפעילים את מרכז הבקרה של Amazon RDS.
- בחלונית הניווט, לוחצים על מסדי נתונים ובוחרים את מופע מסד הנתונים.
- בתפריט הנפתח פעולות, בוחרים באפשרות הפעלה מחדש ואז לוחצים על אישור.
יצירה של אתר חדשות ושל משבצת שכפול
יוצרים פרסום לשינויים בטבלאות שרוצים לשכפל. מומלץ ליצור פרסום רק לטבלאות שרוצים לשכפל. כך Datastream יכול לקרוא רק את הנתונים הרלוונטיים, והעומס על מסד הנתונים ועל Datastream קטן יותר:
CREATE PUBLICATION PUBLICATION_NAME FOR TABLE SCHEMA1.TABLE1, SCHEMA2.TABLE2;
מחליפים את מה שכתוב בשדות הבאים:
- PUBLICATION_NAME: שם הפרסום. תצטרכו לספק את השם הזה כשתיצרו מקור נתונים באשף ליצירת מקורות נתונים ב-Datastream.
- SCHEMA: השם של הסכימה שמכילה את הטבלה.
- TABLE: השם של הטבלה שרוצים לשכפל.
אפשר גם ליצור פרסום לכל הטבלאות במסד הנתונים. שימו לב: הגישה הזו מגדילה את העומס גם על מסד הנתונים של המקור וגם על Datastream:
CREATE PUBLICATION PUBLICATION_NAME FOR ALL TABLES;
יוצרים משבצת שכפול באמצעות הפקודה הבאה של PostgreSQL:
SELECT PG_CREATE_LOGICAL_REPLICATION_SLOT('REPLICATION_SLOT_NAME', 'pgoutput');מחליפים את מה שכתוב בשדות הבאים:
- REPLICATION_SLOT_NAME: השם של משבצת השכפול. תצטרכו לספק את השם הזה כשתיצרו מקור נתונים באשף ליצירת מקורות נתונים ב-Datastream.
יצירת משתמש Datastream
כדי ליצור משתמש Datastream, מזינים את פקודת PostgreSQL הבאה:
CREATE USER USER_NAME WITH ENCRYPTED PASSWORD 'USER_PASSWORD';
מחליפים את מה שכתוב בשדות הבאים:
- USER_NAME: השם של משתמש Datastream שרוצים ליצור.
- USER_PASSWORD: הסיסמה של משתמש Datastream שרוצים ליצור.
מעניקים למשתמש שיצרתם את ההרשאות הבאות:
GRANT RDS_REPLICATION TO USER_NAME; GRANT SELECT ON ALL TABLES IN SCHEMA SCHEMA_NAME TO USER_NAME; GRANT USAGE ON SCHEMA SCHEMA_NAME TO USER_NAME; ALTER DEFAULT PRIVILEGES IN SCHEMA SCHEMA_NAME GRANT SELECT ON TABLES TO USER_NAME;
מחליפים את מה שכתוב בשדות הבאים:
- SCHEMA_NAME: השם של הסכימה שרוצים לתת לה את ההרשאות.
- USER_NAME: המשתמש שרוצים להעניק לו את ההרשאות.