ההנחיות בדף הזה מניחות שאשכולות מסדי הנתונים של המקור והיעד נוצרו ב-Google Kubernetes Engine, ודיסקי הגיבוי הם דיסקים קבועים של Compute Engine. בנוסף, ההנחה היא שדיסקים קבועים של Compute Engine שמשמשים כגיבוי במסד הנתונים לא נמצאים בשימוש של אף אשכול אחר של מסד נתונים.
בתרשים זרימת העבודה הבא מוסבר איך לשכפל:
- מזהים את פרטי דיסק הגיבוי, כמו שם הנפח המתמיד ומטפל הדיסק המתמיד של Compute Engine, עבור דיסק הגיבוי של אשכול מסד הנתונים של המקור.
- יוצרים משאב
PersistentVolumeכדי להשתמש בדיסק גיבוי קיים באשכול מסד הנתונים של היעד כדי לגשת לדיסק הגיבוי של אשכול מסד הנתונים של המקור. - יוצרים ומחילים את קובץ המניפסט של משאב
DBClusterבאשכול מסד הנתונים של היעד, כשהפרמטרlivenessProbeמושבת ופרטי הדיסק של הגיבוי מתווספים. - משתמשים בפקודות של
pgBackRestכדי לוודא שאפשר לגשת לגיבויים של המקור. - משתמשים בפקודות
pgBackRestכדי לשחזר את הגיבוי לאשכול מסד הנתונים של היעד.
לפני שמתחילים
- מוודאים שיש לכם גישה לדיסק הגיבוי שבו מאוחסן הגיבוי של אשכול מסד הנתונים של המקור.
- צריכה להיות אפשרות לטעון את דיסק הגיבוי של אשכול מסד הנתונים של המקור באשכול מסד הנתונים של היעד. מידע נוסף על השלבים להבטחת האפשרות להרכבת הדיסק מופיע במאמר בנושא נפחים קבועים.
- מכיוון שדיסק הגיבוי של המקור מחובר לאשכול מסד הנתונים של היעד, נעשה שימוש חוזר בקובץ
pgBackRest.confכמו שהוא. - מוודאים שאתם מחוברים למסד הנתונים כמשתמש
postgres.
קבלת מידע על דיסק הגיבוי של המקור
כחלק מתהליך השחזור, צריך לקבוע את השם של התביעה על נפח אחסון מתמיד (PVC) של דיסק הגיבוי עבור אשכול מסד הנתונים של המקור. משתמשים ב-PVC ב-Kubernetes כדי לנהל אחסון מתמיד לאפליקציות.
פקודות הדוגמה הבאות עוזרות לאתר את השם הבסיסי של ה-PV ואת ה-handler של דיסק אחסון מתמיד (persistent disk) של Compute Engine. בדוגמה, כל דיסקי הגיבוי הם דיסקים קבועים של Compute Engine, שאפשר לגשת אליהם במכונות וירטואליות של Compute Engine באמצעות מזהה הדיסק.
כדי למצוא את השם של ה-PVC, מתחברים לאשכול מסד הנתונים של היעד:
kubectl get pvc -n DB_CLUSTER_NAMESPACE | grep DB_CLUSTER_NAME | grep backuprepodiskמחליפים את מה שכתוב בשדות הבאים:
DB_CLUSTER_NAMESPACE: מרחב השמות של Kubernetes לתוכנית הגיבוי הזו. הוא חייב להיות זהה למרחב השמות של אשכול מסד הנתונים.
DB_CLUSTER_NAME: השם של אשכול מסד הנתונים הזה, לדוגמהmy-db-cluster.
זוהי דוגמה לתשובה.
backuprepodisk-my-db-cluster-br-0 Bound pvc-36d8f05d-ef1a-4750-ac01-9bb330c15b3a 10Gi RWO standard-rwo 5d21hמשתמשים בשם ה-PVC של דיסק הגיבוי מהשלב הקודם – לדוגמה,
backuprepodisk-my-db-cluster-br-0, כדי למצוא את שם ה-PV הבסיסי ואת המטפל בדיסק אחסון מתמיד (persistent disk) של Compute Engine:kubectl get pvc/PVC_NAME -n DB_CLUSTER_NAMESPACE -o jsonpath={.spec.volumeName}מחליפים את מה שכתוב בשדות הבאים:
-
PVC_NAME: השם של ה-PVC של דיסק הגיבוי מהתגובה בשלב הקודם, לדוגמהbackuprepodisk-my-db-cluster-br-0.
-
מייצאים את ההגדרות על סמך שם ה-PV כמשתנים לשימוש בקטעים הבאים:
export DISK_SIZE=$(kubectl get pv/PV_NAME -o jsonpath="{.spec.capacity.storage}") export FS_TYPE=$(kubectl get pv/PV_NAME -o jsonpath="{.spec.csi.fsType}") export VOLUME_HANDLER=$(kubectl get pv/PV_NAME -o jsonpath="{.spec.csi.volumeHandle}") export STORAGE_CLASS=$(kubectl get pv/PV_NAME -o jsonpath="{.spec.storageClassName}")מחליפים את מה שכתוב בשדות הבאים:
-
PV_NAME: השם של ה-PV של דיסק הגיבוי מהתגובה בשלב הקודם.
-
יצירת משאב של נפח אחסון מתמיד באשכול מסד הנתונים של היעד
יוצרים משאב PersistentVolume באמצעות שם ה-handler של הדיסק.
במסד הנתונים היעד, יוצרים את
PersistentVolumeקובץ המניפסט:apiVersion: v1 kind: PersistentVolume metadata: name: backupdisk spec: storageClassName: "${STORAGE_CLASS}" capacity: storage: "${DISK_SIZE}" accessModes: - ReadWriteOnce csi: driver: pd.csi.storage.gke.io volumeHandle: "${VOLUME_HANDLER}" fsType: "${FS_TYPE}"החלת קובץ המניפסט:
kubectl apply -f PV_FILENAMEמחליפים את מה שכתוב בשדות הבאים:
- PV_FILENAME: השם של קובץ המניפסט
PersistentVolumeשנוצר בשלב הקודם.
- PV_FILENAME: השם של קובץ המניפסט
יצירת אשכול מסד נתונים של יעד
כדי ליצור אשכול מסדי נתונים, משביתים באופן זמני את הפרמטר livenessProbe עד לסיום תהליך השחזור.
יוצרים את קובץ המניפסט
DBCluster:apiVersion: v1 kind: Secret metadata: name: db-pw-DB_CLUSTER_NAME type: Opaque data: DB_CLUSTER_NAME: "ENCODED_PASSWORD" --- apiVersion: alloydbomni.dbadmin.goog/v1 kind: DBCluster metadata: name: DB_CLUSTER_NAME spec: primarySpec: availabilityOptions: livenessProbe: "Disabled" adminUser: passwordRef: name: db-pw-DB_CLUSTER_NAME resources: memory: 100Gi cpu: 10 disks: - name: DataDisk size: 40Gi - name: BackupDisk size: ${DISK_SIZE} storageClass: ${STORAGE_CLASS} volumeName: backupdiskמחליפים את מה שכתוב בשדות הבאים:
DB_CLUSTER_NAME: השם של אשכול מסד הנתונים הזה, לדוגמהmy-db-cluster.
ENCODED_PASSWORD: הסיסמה להתחברות למסד הנתונים עבור תפקיד המשתמש שמוגדר כברירת מחדלpostgres, בקידוד כמחרוזת base64. לדוגמה,Q2hhbmdlTWUxMjM=עבורChangeMe123.
החלת קובץ המניפסט:
kubectl apply -f DBCLUSTER_FILENAMEמחליפים את מה שכתוב בשדות הבאים:
- DBCLUSTER_FILENAME: השם של קובץ המניפסט
DBClusterשנוצר בשלב הקודם.
- DBCLUSTER_FILENAME: השם של קובץ המניפסט
משתמשים בפקודה kubectl describe כדי לוודא שמשאב אשכול מסד הנתונים נמצא בסטטוס READY.
אימות גיבויי המקור באשכול מסד הנתונים של היעד
מריצים פקודות pgBackRest כדי לוודא שיש גישה לגיבויים של אשכול מסד הנתונים של המקור באשכול מסד הנתונים של היעד.
בצבר מסדי הנתונים של היעד, מאתרים את פרטי ה-Pod של צבר מסדי הנתונים:
kubectl get pod -l "alloydbomni.internal.dbadmin.goog/dbcluster=DB_CLUSTER_NAME, alloydbomni.internal.dbadmin.goog/task-type=database"התשובה כוללת את השם של ה-pod של מסד הנתונים של האשכול.
מתחברים ל-Pod של מסד הנתונים:
kubectl exec -ti DATABASE_POD_NAME -- /bin/bashמחליפים את מה שכתוב בשדות הבאים:
- DATABASE_POD_NAME : השם של הפוד של אשכול מסד הנתונים מהשלב הקודם.
מפסיקים את הפוד לפני העדכון של קובץ התצורה
pgBackRest:supervisorctl.par stop postgresמעדכנים את קובץ התצורה
pgBackRest:cp /backup/pgbackrest.conf pgbackrest.conf.bak rm /backup/pgbackrest.conf cat << EOF > /backup/pgbackrest.conf [db] pg1-path=/mnt/disks/pgsql/data pg1-socket-path=/tmp pg1-user=pgbackrest[global] log-path=/backup/logs log-level-file=info EOFמאמתים את גיבויי המקור ב-Pod של אשכול מסד הנתונים:
pgbackrest --config-path=/backup --stanza=db --repo=1 infoזוהי דוגמה לתשובה:
stanza: db status: ok cipher: none db (current) wal archive min/max (15): 000000010000000000000002/00000001000000000000000D full backup: 20240213-231400F timestamp start/stop: 2024-02-13 23:14:00+00 / 2024-02-13 23:17:14+00 wal start/stop: 000000010000000000000003 / 000000010000000000000003 database size: 38.7MB, database backup size: 38.7MB repo1: backup set size: 4.6MB, backup size: 4.6MB incr backup: 20240213-231400F_20240214-000001I timestamp start/stop: 2024-02-14 00:00:01+00 / 2024-02-14 00:00:05+00 wal start/stop: 00000001000000000000000D / 00000001000000000000000D database size: 38.7MB, database backup size: 488.3KB repo1: backup set size: 4.6MB, backup size: 84.2KB backup reference list: 20240213-231400F
חותמות הזמן בתשובה משמשות לשחזור הגיבוי המלא או לשחזור מנקודת זמן בחלון השחזור.
שחזור הגיבוי באשכול מסד הנתונים של היעד
אחרי שמזהים את הגיבוי או את נקודת הזמן שרוצים לשחזר, מריצים פקודות pgBackRest באשכול מסד הנתונים של היעד. מידע נוסף על הפקודות האלה זמין במאמר פקודת שחזור.
הנה כמה דוגמאות לפקודות שחזור של pgBackRest:
שחזור מגיבוי
pgbackrest --config-path=/backup --stanza=db --repo=1 restore --set=20240213-231400F --type=immediate --target-action=promote --delta --link-all --log-level-console=infoשחזור מנקודה מסוימת בזמן
pgbackrest --config-path=/backup --stanza=db --repo=1 restore --target="2024-01-22 11:27:22" --type=time --target-action=promote --delta --link-all --log-level-console=info
הפעלה מחדש של ה-pod
אחרי שהפקודה לשחזור מסתיימת בהצלחה, אפשר להתחיל את התהליך postgres.
supervisorctl.par start postgresאחרי שתהליך postgres מתחיל, אפשר להתחבר למופע הראשי ולהריץ שאילתות כדי לוודא שהנתונים שוחזרו מהגיבוי. מידע נוסף זמין במאמר התחברות ל-AlloyDB Omni שפועל ב-Kubernetes.