בדף הזה מוסבר איך להגדיר לכידת נתונים של שינויים (CDC) כדי להזרים נתונים ממסד נתונים של Amazon RDS for MySQL אל יעד נתמך, כמו BigQuery או Cloud Storage.
יצירת קבוצת פרמטרים
מפעילים את מרכז הבקרה של Amazon RDS.
בחלונית הניווט הנפתחת, לוחצים על קבוצות פרמטרים.
לוחצים על יצירת קבוצת פרמטרים. יופיע הדף Create Parameter Group.
בוחרים את משפחת מסדי הנתונים שתואמת למסד הנתונים שלכם, ומזינים שם ותיאור לקבוצת הפרמטרים.
לוחצים על יצירה.
מסמנים את התיבה שמשמאל לקבוצת הפרמטרים החדשה שיצרתם.
בקטע פעולות של קבוצת פרמטרים, לוחצים על עריכה.
משתמשים בטבלה הבאה כדי להגדיר את הפרמטרים של הקבוצה.
לרפליקציה מבוססת binlog:
פרמטר ערך binlog_format ROWlog_bin_use_v1_row_events 1read_only 0net_read_timeout 3600net_write_timeout 3600wait_timeout 86400לרפליקציה מבוססת GTID:
פרמטר ערך binlog_format ROWlog_bin_use_v1_row_events 1read_only 0net_read_timeout 3600net_write_timeout 3600wait_timeout 86400expire-logs-days 7binlog_row_image FULLmax_allowed_packet 1G(ערך מומלץ)log-replica-updates 1enforce-gtid-consistency ONgtid_mode
אפשר להגדיר את הפרמטר הזה לערךONONרק אחרי שמגדירים את הפרמטרenforce-gtid-consistencyלערךON. באופן כללי,gtid_modeיכול לקבל את הערכים הבאים:OFFOFF_PERMISSIVEON_PERMISSIVEON
gtid_modeרק בשלב אחד בכל פעם. לדוגמה, אם המצב הנוכחי מוגדר ל-OFF, צריך לבצע את הפעולות הבאות:- משנים את ההגדרה ל-
OFF_PERMISSIVE. - משנים את ההגדרה ל-
ON_PERMISSIVE. - משנים את ההגדרה ל-
ON.
לוחצים על שמירת השינויים.
יצירת עותק לקריאה
מפעילים את מרכז הבקרה של Amazon RDS.
בחלונית הניווט, לוחצים על Databases (מסדי נתונים).
בוחרים את מופע מסד הנתונים הראשי שאליו רוצים ש-Datastream יתחבר.
מרחיבים את הלחצן Actions (פעולות) ולוחצים על Create read replica (יצירת רפליקה לקריאה).
מגדירים את העותק לקריאה לפי הצורך.
לוחצים על יצירת עותק לקריאה.
הגדרת מסד הנתונים של המקור והעותק לקריאה
אם בחרתם לשכפל ישירות מהשרת הראשי, צריך להגדיר את מסד הנתונים של המקור באמצעות השלבים הבאים.
אם בחרתם להשתמש בעותק לקריאה, אתם צריכים להגדיר גם את מסד הנתונים המקורי וגם את העותק לקריאה באמצעות השלבים הבאים.
מפעילים את מרכז הבקרה של Amazon RDS.
בחלונית הניווט, לוחצים על Databases (מסדי נתונים).
בוחרים את המופע שרוצים להגדיר ולוחצים על שינוי.
עוברים לקטע הגדרה נוספת.
בוחרים את קבוצת הפרמטרים שיצרתם.
מגדירים את תקופת השמירה של הגיבוי ל-7 ימים.
לוחצים על Continue.
בקטע תזמון השינויים, בוחרים באפשרות החלת השינויים באופן מיידי.
אימות הקצאה של קבוצת פרמטרים למופע של מסד נתונים
מפעילים את מרכז הבקרה של Amazon RDS.
בחלונית הניווט, לוחצים על מסדי נתונים ובוחרים את מופע מסד הנתונים.
לוחצים על הכרטיסייה Configurations.
מוודאים שקבוצת הפרמטרים שיצרתם מופיעה, ושהסטטוס שלה הוא pending-reboot.
מפעילים מחדש את מופע מסד הנתונים כדי להשלים את ההגדרה. כדי להפעיל מחדש את המופע:
- ב-Navigation Drawer, לוחצים על Instances.
- בוחרים את מופע מסד הנתונים.
- בתפריט פעולות של מופע, בוחרים באפשרות הפעלה מחדש.
הגדרת תקופת השמירה של יומן בינארי
מזינים את פקודת MySQL הבאה:
call mysql.rds_set_configuration('binlog retention hours', 168);
מפעילים מחדש את שרת MySQL כדי שהשינויים שביצעתם ייכנסו לתוקף.
יצירת משתמש Datastream
יוצרים משתמש Datastream:
CREATE USER 'datastream'@'%' IDENTIFIED BY 'YOUR_PASSWORD';
מעניקים להם את ההרשאות הבאות:
GRANT REPLICATION SLAVE, SELECT, REPLICATION CLIENT ON *.* TO 'datastream'@'%'; GRANT EXECUTE ON PROCEDURE mysql.rds_show_configuration TO 'datastream'@'%'; FLUSH PRIVILEGES;