ההנחות הבאות מבוססות על המסמך הזה:
- אשכולות מסדי הנתונים של המקור והיעד נוצרים ב-Google Kubernetes Engine, והדיסקים של הגיבוי הם דיסקים קבועים של Compute Engine.
- דיסקים קבועים ב-Compute Engine שמשמשים כדיסק גיבוי במסד הנתונים לא משמשים באשכולות אחרים של מסדי נתונים.
כשמשכפלים אשכול מסדי נתונים, פועלים לפי השלבים הבאים:
- מזהים את פרטי דיסק הגיבוי, כמו שם הנפח המתמשך ומטפל הדיסק אחסון מתמיד (persistent disk) של Compute Engine עבור דיסק הגיבוי של אשכול מסד הנתונים של המקור. מוודאים שהפעלתם את תכונת הגיבוי עבור אשכול מסד הנתונים של המקור, ושיש לכם גיבוי אחד לפחות שבוצע בהצלחה. אם התנאים האלה לא מתקיימים, צריך לפעול לפי ההוראות במאמר הפעלה ותזמון של גיבויים.
- יוצרים משאב
PersistentVolumeכדי להשתמש בדיסק גיבוי קיים באשכול מסד הנתונים של היעד כדי לגשת לדיסק הגיבוי של אשכול מסד הנתונים של המקור. - יוצרים ומחילים את קובץ המניפסט של משאב
DBClusterבאשכול מסד הנתונים של היעד, כשהפרמטרlivenessProbeמושבת ופרטי הדיסק של הגיבוי מתווספים. - משתמשים בפקודות של
pgBackRestכדי לוודא שאפשר לגשת לגיבויים של המקור. - משתמשים בפקודות
pgBackRestכדי לשחזר את הגיבוי לאשכול מסד הנתונים של היעד.
לפני שמתחילים
- מוודאים שיש לכם גישה לדיסק הגיבוי שבו מאוחסן הגיבוי של אשכול מסד הנתונים של המקור.
- צריכה להיות אפשרות לטעון את דיסק הגיבוי של אשכול מסד הנתונים של המקור באשכול מסד הנתונים של היעד. מידע נוסף זמין במאמר בנושא Persistent Volumes. אם קצה העורף של האחסון הבסיסי לא תומך בגישת ReadOnlyMany (ROX), צריך לוודא שאף פוד באשכול המקור לא משתמש בדיסק הגיבוי.
- מכיוון שדיסק הגיבוי של המקור מחובר לאשכול מסד הנתונים של היעד, נעשה שימוש חוזר בקובץ
pgBackRest.confכמו שהוא. - מוודאים שאתם מחוברים למסד הנתונים כמשתמש
postgres.
קבלת מידע על דיסק הגיבוי של המקור
כחלק מתהליך השחזור, צריך לקבוע את השם של התביעה על נפח אחסון מתמיד (PVC) של דיסק הגיבוי עבור אשכול מסד הנתונים של המקור. משתמשים ב-PVC ב-Kubernetes כדי לנהל אחסון מתמיד לאפליקציות.
פקודות הדוגמה הבאות עוזרות לאתר את השם הבסיסי של ה-PV ואת ה-handler של דיסק אחסון מתמיד (persistent disk) של Compute Engine. בדוגמה, כל דיסקי הגיבוי הם דיסקים קבועים של Compute Engine, שאפשר לגשת אליהם במכונות וירטואליות של Compute Engine באמצעות מזהה הדיסק.
כדי למצוא את השם של ה-PVC, מתחברים לאשכול מסד הנתונים של היעד:
kubectl get pvc -n DB_CLUSTER_NAMESPACE | grep DB_CLUSTER_NAME | grep backuprepodiskמחליפים את מה שכתוב בשדות הבאים:
DB_CLUSTER_NAMESPACE: מרחב השמות של Kubernetes לתוכנית הגיבוי הזו. הוא חייב להיות זהה למרחב השמות של אשכול מסד הנתונים.
DB_CLUSTER_NAME: השם של אשכול מסד הנתונים הזה, לדוגמהmy-db-cluster.
זוהי דוגמה לתשובה.
backuprepodisk-my-db-cluster-br-0 Bound pvc-36d8f05d-ef1a-4750-ac01-9bb330c15b3a 10Gi RWO standard-rwo 5d21hמשתמשים בשם ה-PVC של דיסק הגיבוי מהשלב הקודם – לדוגמה,
backuprepodisk-my-db-cluster-br-0, כדי למצוא את שם ה-PV הבסיסי ואת המטפל בדיסק אחסון מתמיד (persistent disk) של Compute Engine:kubectl get pvc/PVC_NAME -n DB_CLUSTER_NAMESPACE -o jsonpath={.spec.volumeName}מחליפים את מה שכתוב בשדות הבאים:
-
PVC_NAME: השם של ה-PVC של דיסק הגיבוי מהתגובה בשלב הקודם, לדוגמהbackuprepodisk-my-db-cluster-br-0.
-
מייצאים את ההגדרות על סמך שם ה-PV כמשתנים לשימוש בקטעים הבאים:
export BACKUP_DISK_SIZE=$(kubectl get pv/PV_NAME -o jsonpath="{.spec.capacity.storage}") export FS_TYPE=$(kubectl get pv/PV_NAME -o jsonpath="{.spec.csi.fsType}") export VOLUME_HANDLER=$(kubectl get pv/PV_NAME -o jsonpath="{.spec.csi.volumeHandle}") export STORAGE_CLASS=$(kubectl get pv/PV_NAME -o jsonpath="{.spec.storageClassName}")מחליפים את מה שכתוב בשדות הבאים:
-
PV_NAME: השם של ה-PV של דיסק הגיבוי מהתגובה בשלב הקודם. לדוגמה, "backupDiskVolume".
-
יצירת משאב של נפח אחסון מתמיד
יוצרים משאב PersistentVolume באמצעות שם ה-handler של הדיסק.
באשכול היעד של Kubernetes, יוצרים את קובץ המניפסט
PersistentVolume:apiVersion: v1 kind: PersistentVolume metadata: name: PV_NAME spec: storageClassName: "${STORAGE_CLASS}" capacity: storage: "${BACKUP_DISK_SIZE}" accessModes: - ReadWriteOnce csi: driver: pd.csi.storage.gke.io volumeHandle: "${VOLUME_HANDLER}" fsType: "${FS_TYPE}"מחליפים את מה שכתוב בשדות הבאים:
- PV_NAME: השם של משאב
PersistentVolumeשייווצר.
- PV_NAME: השם של משאב
החלת קובץ המניפסט:
kubectl apply -f PV_FILENAMEמחליפים את מה שכתוב בשדות הבאים:
- PV_FILENAME: השם של קובץ המניפסט
PersistentVolumeשנוצר בשלב הקודם.
- PV_FILENAME: השם של קובץ המניפסט
יצירת אשכול מסד נתונים של יעד
יוצרים אשכול מסדי נתונים על ידי השבתה זמנית של הפרמטר livenessProbe. אחרי שהשחזור מסתיים, מגדירים מחדש את הפרמטר livenessProbe.
יוצרים את קובץ המניפסט
DBCluster:apiVersion: v1 kind: Secret metadata: name: db-pw-DB_CLUSTER_NAME type: Opaque data: DB_CLUSTER_NAME: "ENCODED_PASSWORD" --- apiVersion: alloydbomni.dbadmin.goog/v1 kind: DBCluster metadata: name: DB_CLUSTER_NAME spec: databaseVersion: "15.7.0" primarySpec: availabilityOptions: livenessProbe: "Disabled" adminUser: passwordRef: name: db-pw-DB_CLUSTER_NAME resources: cpu: CPU_COUNT memory: MEMORY_SIZE disks: - name: DataDisk size: DATA_DISK_SIZE - name: BackupDisk size: ${BACKUP_DISK_SIZE} storageClass: ${STORAGE_CLASS} volumeName: PV_NAMEמחליפים את מה שכתוב בשדות הבאים:
DB_CLUSTER_NAME: השם של אשכול מסד הנתונים הזה, לדוגמהmy-db-cluster.
ENCODED_PASSWORD: הסיסמה להתחברות למסד הנתונים עבור תפקיד המשתמש שמוגדר כברירת מחדלpostgres, בקידוד כמחרוזת base64. לדוגמה,Q2hhbmdlTWUxMjM=עבורChangeMe123.
CPU_COUNT: מספר המעבדים הזמינים לכל מופע של מסד נתונים באשכול מסדי הנתונים הזה.
MEMORY_SIZE: כמות הזיכרון לכל מופע של מסד נתונים באשכול מסדי הנתונים הזה. מומלץ להגדיר את הערך הזה ל-8 גיגה-בייט לכל CPU. לדוגמה, אם הגדרתם את CPU_COUNT ל-2, מומלץ להגדיר אתmemoryל-16Gi.
DATA_DISK_SIZE: גודל הדיסק לכל מופע של מסד נתונים, לדוגמה,10Gi.
החלת קובץ המניפסט:
kubectl apply -f DBCLUSTER_FILENAMEמחליפים את מה שכתוב בשדות הבאים:
- DBCLUSTER_FILENAME: השם של קובץ המניפסט
DBClusterשנוצר בשלב הקודם.
- DBCLUSTER_FILENAME: השם של קובץ המניפסט
משתמשים בפקודה kubectl describe כדי לוודא שמשאב אשכול מסד הנתונים נמצא בסטטוס READY.
אימות גיבויי המקור באשכול מסד הנתונים של היעד
מריצים פקודות pgBackRest כדי לוודא שיש גישה לגיבויים של אשכול מסד הנתונים של המקור באשכול מסד הנתונים של היעד.
בצבר מסדי הנתונים של היעד, מאתרים את פרטי ה-Pod של צבר מסדי הנתונים:
kubectl get pod -l "alloydbomni.internal.dbadmin.goog/dbcluster=DB_CLUSTER_NAME, alloydbomni.internal.dbadmin.goog/task-type=database"התשובה כוללת את השם של ה-pod של מסד הנתונים של האשכול.
מתחברים ל-Pod של מסד הנתונים:
kubectl exec -ti DATABASE_POD_NAME -- /bin/bashמחליפים את מה שכתוב בשדות הבאים:
- DATABASE_POD_NAME : השם של הפוד של אשכול מסד הנתונים מהשלב הקודם.
מפסיקים את הפוד לפני העדכון של קובץ התצורה
pgBackRest:supervisorctl.par stop postgresמעדכנים את קובץ התצורה
pgBackRest:cp /backup/pgbackrest.conf /backup/pgbackrest.conf.bak rm /backup/pgbackrest.conf cat << EOF > /backup/pgbackrest.conf [db] pg1-path=/mnt/disks/pgsql/data pg1-socket-path=/tmp pg1-user=pgbackrest[global] log-path=/backup/logs log-level-file=info EOFמאמתים את גיבויי המקור ב-Pod של אשכול מסד הנתונים:
pgbackrest --config-path=/backup --stanza=db --repo=1 infoזוהי דוגמה לתשובה:
stanza: db status: ok cipher: none db (current) wal archive min/max (15): 000000010000000000000002/00000001000000000000000D full backup: 20240213-231400F timestamp start/stop: 2024-02-13 23:14:00+00 / 2024-02-13 23:17:14+00 wal start/stop: 000000010000000000000003 / 000000010000000000000003 database size: 38.7MB, database backup size: 38.7MB repo1: backup set size: 4.6MB, backup size: 4.6MB incr backup: 20240213-231400F_20240214-000001I timestamp start/stop: 2024-02-14 00:00:01+00 / 2024-02-14 00:00:05+00 wal start/stop: 00000001000000000000000D / 00000001000000000000000D database size: 38.7MB, database backup size: 488.3KB repo1: backup set size: 4.6MB, backup size: 84.2KB backup reference list: 20240213-231400F
חותמות הזמן בתשובה משמשות לשחזור הגיבוי המלא או לשחזור מנקודת זמן בחלון השחזור.
שחזור הגיבוי באשכול מסד הנתונים של היעד
אחרי שמזהים את הגיבוי או את נקודת הזמן שרוצים לשחזר, מריצים פקודות pgBackRest באשכול מסד הנתונים של היעד. מידע נוסף על הפקודות האלה זמין במאמר פקודת שחזור.
הנה כמה דוגמאות לפקודות שחזור של pgBackRest:
שחזור מגיבוי
pgbackrest --config-path=/backup --stanza=db --repo=1 restore --set=20240213-231400F --type=immediate --target-action=promote --delta --link-all --log-level-console=infoשחזור מנקודה מסוימת בזמן
pgbackrest --config-path=/backup --stanza=db --repo=1 restore --target="2024-01-22 11:27:22" --type=time --target-action=promote --delta --link-all --log-level-console=info
הפעלה מחדש של ה-pod
אחרי שהפקודה לשחזור מסתיימת בהצלחה, אפשר להתחיל את התהליך postgres.
supervisorctl.par start postgresאחרי שתהליך postgres מתחיל, אפשר להתחבר למופע הראשי ולהריץ שאילתות כדי לוודא שהנתונים שוחזרו מהגיבוי. מידע נוסף זמין במאמר התחברות ל-AlloyDB Omni שפועל ב-Kubernetes.
הגדרת אשכול מסדי הנתונים
אחרי שמשכפלים אשכול מסדי נתונים, מגדירים את המפרטים של אשכול מסד הנתונים. חשוב להפעיל את הפרמטר livenessProbe באמצעות הפקודה הבאה:
kubectl patch dbcluster DBCLUSTER_FILENAME --type merge -p '{"spec":{"primarySpec":{"availabilityOptions":{"livenessProbe":"Enabled"}}}}'