גיבוי ושחזור ב-Kubernetes

בחירת גרסה של מאמר העזרה:

בדף הזה מוסבר איך לגבות ולשחזר את הנתונים שלכם ב-AlloyDB Omni באמצעות AlloyDB Omni Kubernetes operator. לשם כך נדרש ידע בסיסי בעדכון אשכול Kubernetes באמצעות קובצי מניפסט וכלי שורת הפקודה kubectl. מידע נוסף על התקנה והפעלה של AlloyDB Omni באשכול Kubernetes זמין במאמר התקנת AlloyDB Omni ב-Kubernetes.

כדי להפעיל גיבוי ושחזור רציפים ב-AlloyDB Omni, צריך ליצור תוכנית גיבוי לכל אשכול מסד נתונים. הגיבויים מתבצעים על סמך לוחות הזמנים של הגיבויים שמוגדרים במשאב backupPlan. אם לא מוגדר לוח זמנים לגיבוי בתוכנית הגיבוי, המערכת מבצעת גיבויים רציפים מדי יום כברירת מחדל. אפשר לשחזר או לשכפל גיבויים מכל חותמת זמן בחלון השחזור, ברמת דיוק של שניות.

למידע על גיבוי ושחזור של נתונים ב-AlloyDB Omni בהטמעות שאינן Kubernetes, אפשר לעיין במאמרים בנושא הגדרת Barman ל-AlloyDB Omni והגדרת pgBackRest ל-AlloyDB Omni.

הפעלה ותזמון של גיבויים

גיבויים רציפים מופעלים כשיוצרים משאב של תוכנית גיבוי עבור אשכול מסדי הנתונים. כדי להפעיל גיבוי רציף של אשכול מסוים, צריך ליצור משאב backupPlan לכל אשכול מסד נתונים. משאב תוכנית הגיבוי הזה מגדיר את הפרמטרים הבאים:

  • המיקום שבו המפעיל של AlloyDB Omni מאחסן גיבויים. הגיבוי יכול להיות מקומי לאשכול Kubernetes או לקטגוריה של Cloud Storage.

  • אפשרות להגדיר כמה לוחות זמנים לגיבוי שיוצרים באופן אוטומטי גיבויים של full, incremental ו-differential. אפשר להשהות את התזמון הזה בכל שלב, כולל כשמגדירים את תוכנית הגיבוי. אם תוכנית גיבוי מושהית, לא נוצרים גיבויים מתוזמנים, אבל עדיין אפשר להשתמש בה כדי ליצור גיבויים באופן ידני.

    אם לא מציינים לוחות זמנים לגיבוי, ברירת המחדל היא '0 0 * * *', שמבצעת גיבוי מלא יומי בחצות, לפי השעה המקומית.

  • תקופת שמירה לגיבויים מאוחסנים. משך הזמן של הבדיקה נע בין יום אחד ל-90 יום. ערך ברירת המחדל הוא 14.

לכל אשכול מסדי נתונים יכולים להיות כמה תוכניות גיבוי, שלכל אחת מהן יש שם והגדרה משלה. אם יוצרים כמה backupPlan משאבים עם לוחות זמנים שונים לגיבוי של אשכול מסדי נתונים, צריך להגדיר מיקום גיבוי ייחודי לכל משאב גיבוי.

יצירת תוכנית לאחסון גיבויים באופן מקומי

כדי להפעיל גיבויים שמאוחסנים באופן מקומי, צריך להחיל את קובץ המניפסט הבא:

    apiVersion: alloydbomni.dbadmin.goog/v1
    kind: BackupPlan
    metadata:
      name: BACKUP_PLAN_NAME
      namespace: NAMESPACE
    spec:
      dbclusterRef: DB_CLUSTER_NAME
      backupSchedules:
        full: "FULL_CRON_SCHEDULE"
        differential: "DIFF_CRON_SCHEDULE"
        incremental: "INCR_CRON_SCHEDULE"
      backupRetainDays: RETENTION_DAYS
      paused: PAUSED_BOOLEAN

מחליפים את מה שכתוב בשדות הבאים:

  • BACKUP_PLAN_NAME: שם למשאב של תוכנית הגיבוי, לדוגמה backup-plan-1.

  • NAMESPACE: מרחב השמות של Kubernetes לתוכנית הגיבוי הזו. הוא חייב להיות זהה למרחב השמות של אשכול מסד הנתונים.

  • DB_CLUSTER_NAME: השם של אשכול מסד הנתונים שהקציתם לו כשיצרתם אותו.

  • FULL_CRON_SCHEDULE: לוח זמנים לגיבוי ליצירת גיבוי מלא, שמכיל את כל הנתונים, בפורמט cron. לדוגמה, אם מגדירים את הערך '0 0 * * 0', מתבצע גיבוי מלא בכל יום ראשון בשעה 00:00.

  • DIFF_CRON_SCHEDULE: לוח זמנים לגיבוי כדי ליצור גיבויים שהם גיבויים מלאים בהתחלה. גיבויים עוקבים הם דיפרנציאליים, ומבוססים על שינויים שהתרחשו בנתונים, בפורמט cron. לדוגמה, אם מגדירים את הערך '0 22 * * 3', הגיבוי הדיפרנציאלי יתבצע בשעה 22:00 בכל יום רביעי.

  • INCR_CRON_SCHEDULE: תזמון גיבוי ליצירת גיבויים שכוללים נתונים שהשתנו מאז הגיבוי המלא, הדיפרנציאלי או המצטבר האחרון. הערך הזה צריך להיות בפורמט cron. לדוגמה, אם מגדירים את הערך ל-"0 21 * * *", מתבצע גיבוי מצטבר בכל יום בשעה 21:00.

  • RETENTION_DAYS: מספר הימים שבהם האופרטור של AlloyDB Omni שומר את הגיבוי הזה. הערך חייב להיות מספר שלם בין 1 ל-90. ערך ברירת המחדל הוא 14.

  • PAUSED_BOOLEAN: מציין אם תוכנית הגיבוי מושהית או לא. מציינים אחד מהערכים הבאים:

    • true: הגיבויים מושהים ולא נוצרים גיבויים מתוזמנים.

    • false: האופרטור AlloyDB Omni יוצר גיבויים לפי לוח הזמנים שצוין על ידי cronSchedule. זה ערך ברירת המחדל, אם לא הוגדר במפורש true.

    ערך ברירת המחדל הוא false.

יצירת תוכנית לאחסון גיבויים ב-Cloud Storage

כדי להפעיל גיבויים שמאוחסנים ב-Cloud Storage, פועלים לפי השלבים הבאים:

  1. יוצרים קטגוריה של Cloud Storage. חשוב לזכור את השם שנותנים לקטגוריה, כי תצטרכו להשתמש בו בהמשך.

  2. יוצרים חשבון שירות כדי להוסיף גיבויים למאגר.

  3. מקצים לחשבון השירות את התפקיד storage.objectAdmin בניהול זהויות והרשאות גישה (IAM).

  4. יוצרים מפתח לחשבון השירות. המפתח הפרטי יורד לסביבה המקומית.

  5. משנים את השם של קובץ המפתח שהורדתם ל-key.json.

  6. יוצרים סוד של Kubernetes שמכיל את המפתח הפרטי:

    kubectl create secret generic SECRET_NAME --from-file=KEY_PATH -n NAMESPACE

    מחליפים את מה שכתוב בשדות הבאים:

    • SECRET_NAME: השם של הסוד ב-Kubernetes שאתם יוצרים. לדוגמה, gcs-key.

    • KEY_PATH: הנתיב במערכת הקבצים המקומית לקובץ key.json שהורדתם בשלבים הקודמים.

    • NAMESPACE: מרחב השמות של אשכול מסד הנתונים.

  7. מחילים את קובץ המניפסט הבא:

      apiVersion: alloydbomni.dbadmin.goog/v1
      kind: BackupPlan
      metadata:
        name: BACKUP_PLAN_NAME
        namespace: NAMESPACE
      spec:
        dbclusterRef: DB_CLUSTER_NAME
        backupSchedules:
          full: "FULL_CRON_SCHEDULE"
          differential: "DIFF_CRON_SCHEDULE"
          incremental: "INCR_CRON_SCHEDULE"
        backupRetainDays: RETENTION_DAYS
        paused: PAUSED_BOOLEAN
        backupLocation:
          type: GCS
          gcsOptions:
            bucket: BUCKET_URL
            key: BACKUP_PATH
            secretRef:
              name: SECRET_NAME
              namespace: NAMESPACE
    

    מחליפים את מה שכתוב בשדות הבאים:

    • BACKUP_PLAN_NAME: שם למשאב של תוכנית הגיבוי, לדוגמה backup-plan-1.

    • NAMESPACE: מרחב השמות של Kubernetes לתוכנית הגיבוי הזו. הוא חייב להיות זהה למרחב השמות של אשכול מסד הנתונים.

    • DB_CLUSTER_NAME: השם של אשכול מסד הנתונים שהקציתם לו כשיצרתם אותו.

    • FULL_CRON_SCHEDULE: לוח זמנים לגיבוי ליצירת גיבוי מלא, שמכיל את כל הנתונים, בפורמט cron. לדוגמה, אם מגדירים את הערך '0 0 * * 0', מתבצע גיבוי מלא בכל יום ראשון בשעה 00:00.

    • DIFF_CRON_SCHEDULE: לוח זמנים לגיבוי כדי ליצור גיבויים שהם גיבויים מלאים בהתחלה. גיבויים עוקבים הם דיפרנציאליים, ומבוססים על שינויים שהתרחשו בנתונים, בפורמט cron. לדוגמה, אם מגדירים את הערך '0 22 * * 3', הגיבוי הדיפרנציאלי יתבצע בשעה 22:00 בכל יום רביעי.

    • INCR_CRON_SCHEDULE: תזמון גיבוי ליצירת גיבויים שכוללים נתונים שהשתנו מאז הגיבוי המלא, הדיפרנציאלי או המצטבר האחרון. הערך הזה צריך להיות בפורמט cron. לדוגמה, אם מגדירים את הערך ל-"0 21 * * *", מתבצע גיבוי מצטבר בכל יום בשעה 21:00.

    • RETENTION_DAYS: מספר הימים שבהם האופרטור של AlloyDB Omni שומר את הגיבוי הזה. הערך חייב להיות מספר שלם בין 1 ל-90. ערך ברירת המחדל הוא 14.

    • PAUSED_BOOLEAN: מציין אם תוכנית הגיבוי מושהית או לא. מציינים אחד מהערכים הבאים:

      • true: הגיבויים מושהים ולא נוצרים גיבויים מתוזמנים.

      • false: האופרטור AlloyDB Omni יוצר גיבויים לפי לוח הזמנים שצוין על ידי cronSchedule. זה ערך ברירת המחדל, אם לא הוגדר במפורש true.

      ערך ברירת המחדל הוא false.

    • BUCKET_URL: השם של הקטגוריה ב-Cloud Storage שיצרתם בשלב קודם. זו לא כתובת ה-URL המלאה של הקטגוריה. אל תוסיפו את הקידומת gs:// לשם הקטגוריה.

    • BACKUP_PATH: הנתיב של הספרייה שבה האופרטור של AlloyDB Omni כותב גיבויים, בתוך קטגוריית Cloud Storage. הנתיב חייב להיות מוחלט ולהתחיל ב-/.

    • SECRET_NAME: השם שבחרתם לסוד של Kubernetes שיצרתם בשלב קודם.

יצירת גיבוי באופן ידני

בכל שלב אפשר ליצור משאב גיבוי באופן ידני, באמצעות כל תוכנית גיבוי שכבר הוחלה על אשכול מסדי נתונים. האופרטור של AlloyDB Omni מחיל על הגיבוי הידני החדש את מיקום האחסון ותקופת השמירה של תוכנית הגיבוי שנבחרה.

כדי ליצור גיבוי באופן ידני, צריך להחיל את המניפסט הבא:

apiVersion: alloydbomni.dbadmin.goog/v1
kind: Backup
metadata:
  name: BACKUP_NAME
  namespace: NAMESPACE
spec:
  dbclusterRef: DB_CLUSTER_NAME
  backupPlanRef: BACKUP_PLAN_NAME
  manual: true
  physicalBackupSpec:
    backupType: BACKUP_TYPE

מחליפים את מה שכתוב בשדות הבאים:

  • BACKUP_NAME: שם לגיבוי הזה, לדוגמה backup-1.

  • NAMESPACE: מרחב השמות של Kubernetes של השחזור הזה. הוא צריך להיות זהה למרחב השמות של אשכול מסד הנתונים.

  • BACKUP_PLAN_NAME: השם של משאב תוכנית הגיבוי שאליו שייך הגיבוי הזה. השם צריך להיות זהה לשם שבחרתם כשיצרתם את תוכנית הגיבוי.

  • DB_CLUSTER_NAME: השם של אשכול מסד הנתונים שהקציתם לו כשיצרתם אותו.

  • BACKUP_TYPE: מציין את סוג הגיבוי הידני שרוצים ליצור. בוחרים אחד מהערכים הבאים:

    • full: יצירת גיבוי מלא, שמכיל את כל הנתונים.

    • diff: יוצר גיבוי דיפרנציאלי שתלוי בגיבוי המלא האחרון. גיבויי המשנה הם דיפרנציאליים, ומבוססים על שינויים שהתרחשו בנתונים מאז הגיבוי הקודם.

    • incr: יוצר גיבוי מצטבר שתלוי בגיבוי המלא או בגיבוי ההפרש הקודם, כדי לכלול נתונים שהשתנו מאז הגיבוי המלא או גיבוי ההפרש האחרון.

מעקב אחר הגיבויים ורשימתם

תוכניות הגיבוי והגיבויים הם משאבים באשכול Kubernetes. כדי לראות מידע עליהם, משתמשים בפקודה kubectl get.

צפייה בסיכום של תוכנית הגיבוי

כדי לראות מידע על תוכניות הגיבוי של אשכול מסד הנתונים, מריצים את הפקודה הבאה:

kubectl get backupplan.alloydbomni.dbadmin.goog -n NAMESPACE

מחליפים את NAMESPACE במרחב השמות של אשכול מסד הנתונים.

הפלט אמור להיראות כך:

NAME               PHASE   LASTBACKUPTIME         NEXTBACKUPTIME
backup-plan-prod   Ready   2023-10-26T17:26:43Z   2023-10-27T00:00:00Z

צפייה ברשימת הגיבויים

כדי לראות רשימה של הגיבויים שזמינים לאשכול מסד הנתונים, מריצים את הפקודה הבאה:

kubectl get backup.alloydbomni.dbadmin.goog -n NAMESPACE

מחליפים את NAMESPACE במרחב השמות של אשכול מסד הנתונים.

הפלט אמור להיראות כך:

NAME                              PHASE       COMPLETETIME               TYPE
backup-plan-prod-20231026172643   Succeeded   2023-10-26T17:26:53Z       full
manual-backup-1                   Succeeded   2023-10-26T18:15:27Z       full
manual-backup-2                   InProgress                             full

כל שורה בטבלת הפלט מייצגת משאב גיבוי, עם המאפיינים הבאים:

  • שם הגיבוי.
  • מצב הגיבוי, כאשר Succeeded מציין גיבוי שמוכן לשחזור.
  • חותמת הזמן של יצירת הגיבוי.

שחזור מגיבוי

‫AlloyDB מאפשר לכם לשחזר מגיבויים ספציפיים או לשכפל אשכול באמצעות גיבוי מנקודת זמן ספציפית.

שחזור מגיבוי עם שם

כדי לשחזר מגיבוי ולהחליף את הנתונים באשכול מסד הנתונים בנתונים שבגיבוי, פועלים לפי השלבים הבאים.

  1. רשימה של כל הגיבויים שהשלב שלהם הוא Succeeded.

    kubectl get backup.alloydbomni.dbadmin.goog -n NAMESPACE | grep Succeeded

    מחליפים את NAMESPACE במרחב השמות של אשכול מסד הנתונים.

    אם יש לפחות מועמד אחד טוב לגיבוי, הפלט ייראה כך:

    backup-plan-prod-20231026172643   Succeeded   2023-10-26T17:26:53Z
    manual-backup-1                   Succeeded   2023-10-26T18:15:27Z
    
  2. בוחרים אחד מהגיבויים שמופיעים בשלב הקודם כגיבוי שממנו רוצים לשחזר. חשוב לשים לב לשם שלו, כי תצטרכו להזין אותו בשלב הבא.

  3. מחילים את קובץ המניפסט הבא:

      apiVersion: alloydbomni.dbadmin.goog/v1
      kind: Restore
      metadata:
        name: RESTORE_NAME
        namespace: NAMESPACE
      spec:
        sourceDBCluster: DB_CLUSTER_NAME
        backup: BACKUP_NAME
    

    מחליפים את מה שכתוב בשדות הבאים:

    • RESTORE_NAME: שם לשימוש במשאב data-restore שהמניפסט הזה יוצר – לדוגמה, restore-1.

    • DB_CLUSTER_NAME: השם של אשכול מסד הנתונים שהקציתם לו כשיצרתם אותו.

    • BACKUP_NAME: השם של הגיבוי שבחרתם בשלב הקודם.

שיבוט של אשכול מנקודת זמן מסוימת

מפעיל AlloyDB Omni מאפשר לשכפל את נתוני האשכול מכל נקודת זמן בחלון השחזור. משך חלון השחזור נקבע ישירות לפי תקופת השמירה.

לדוגמה, אם תקופת השמירה מוגדרת ל-14 ימים, לא תוכלו לשחזר נתונים בני יותר מ-14 ימים. אפשר לשחזר לכל נקודת זמן בחלון השחזור. האופרטור של AlloyDB Omni שומר גיבויים ויומנים למשך יום אחד יותר מהערך שצוין.

  1. עוקבים אחרי חלון ההתאוששות כדי לזהות את נקודת השחזור:

    kubectl get backupplan.alloydbomni.dbadmin.goog BACKUP_NAME -n NAMESPACE -o json | jq .status.recoveryWindow
    

    זוהי דוגמה לתשובה:

    recoveryWindow:
    begin: "2024-01-31T02:54:35Z"
    

    ערך חותמת הזמן בפורמט חותמת הזמן RFC 3339 משמש במשאב השחזור.

  2. יוצרים ומחילים את מניפסט משאבי השחזור הבא:

    apiVersion: alloydbomni.dbadmin.goog/v1
    kind: Restore
    metadata:
      name: RESTORE_NAME
      namespace: NAMESPACE
    spec:
      sourceDBCluster: DB_CLUSTER_NAME
      pointInTime: "DATE_AND_TIME_STAMP"
      clonedDBClusterConfig:
        dbclusterName: NEW_DB_CLUSTER_NAME
    

    מחליפים את מה שכתוב בשדות הבאים:

    • RESTORE_NAME: שם לשימוש במשאב data-restore שהמניפסט הזה יוצר – לדוגמה, restore-1.

    • DB_CLUSTER_NAME: השם של אשכול מסד הנתונים שהקציתם לו כשיצרתם אותו.

    • DATE_AND_TIME_STAMP: חותמת הזמן בפורמט RFC 3339 ברמת דיוק של דקה של הגיבוי הרציף שרוצים לשחזר ממנו – לדוגמה, 2024-03-05T15:32:10Z.

    • NEW_DB_CLUSTER_NAME: השם של אשכול מסד הנתונים החדש.

צפייה בסטטוס השחזור

  1. כדי לראות את התקדמות פעולת השחזור:

    kubectl get restore.alloydbomni.dbadmin.goog -n NAMESPACE

    מחליפים את NAMESPACE במרחב השמות של אשכול מסד הנתונים.

    כדי להריץ את הפקודה באופן רציף, מוסיפים את הדגל -Aw.

    הפלט אמור להיראות כך:

    NAME        PHASE               COMPLETETIME   RESTOREDPOINTINTIME
    restore-1   RestoreInProgress
    

    אם הערך בעמודה PHASE בטבלת הפלט הוא ProvisionSucceeded, המשמעות היא שהשחזור הושלם.

  2. כדי לראות את התקדמות העלייה לאונליין של מסד הנתונים המשוחזר או המשוכפל:

    kubectl get dbclusters -A -n NAMESPACE

    מחליפים את NAMESPACE במרחב השמות של אשכול מסד הנתונים.

    כדי להריץ את הפקודה באופן רציף, מוסיפים את הדגל -Aw.

    הפלט אמור להיראות כך:

    NAMESPACE   NAME               PRIMARYENDPOINT   PRIMARYPHASE   DBCLUSTERPHASE
    default     db-cluster-1       10.128.0.55       Ready          DBClusterReady
    

    אם הערך בעמודה DBCLUSTERPHASE בטבלת הפלט הוא DBClusterReady, זה אומר שאפשר להשתמש באשכול מסד הנתונים המשוחזר או המשוכפל.

מחיקת גיבוי

בדרך כלל, אין צורך למחוק גיבויים באופן ידני. האופרטור של AlloyDB Omni מוחק באופן אוטומטי גיבויים שנוצרו לפני תקופת השמירה שציינתם כשאתם יוצרים תוכנית גיבוי.

אם רוצים למחוק גיבוי באופן ידני, הגיבוי צריך לעמוד בדרישות הבאות:

  • הגיבוי הוא לא הגיבוי היחיד שמאוחסן בתוכנית הגיבוי שלו. האופרטור AlloyDB Omni דורש שלכל תוכנית גיבוי יהיה לפחות גיבוי אחד.

  • אין גיבויים אחרים שתלויים בגיבוי הזה. לדוגמה, גיבוי מלא עם גיבויים דיפרנציאליים או מצטברים שתלויים בו, או גיבוי מצטבר עם גיבויים דיפרנציאליים שתלויים בו.

כדי למחוק גיבוי, מריצים את הפקודה הבאה:

kubectl delete backup.alloydbomni.dbadmin.goog/BACKUP_NAME -n NAMESPACE

מחליפים את מה שכתוב בשדות הבאים:

  • BACKUP_NAME: השם של הגיבוי שרוצים למחוק.

  • NAMESPACE: מרחב השמות של אשכול מסד הנתונים.

שינוי הגודל של דיסק גיבוי

כדי לשנות את הגודל של הדיסק המקומי שבו נשמרים הגיבויים באשכול Kubernetes, מבצעים את השלבים הבאים:

  1. מעדכנים את השדה resources.disks במניפסט DBCluster באופן הבא:

    spec:
      primarySpec:
        resources:
          disks:
            - name: BACKUP_DISK
              size: 10Gi
    

    מחליפים את BACKUP_DISK בשם הדיסק שבו מאוחסנות הגיבויים.

  2. מחילים את המניפסט כדי לאכוף את העדכון.

    האופרטור AlloyDB Omni מחיל את המפרטים המעודכנים על DBCluster באופן מיידי.

ההגבלות הבאות חלות על שינוי דיסק הגיבוי של אשכול מסדי נתונים פעיל:

  • אפשר להגדיל את הגודל של דיסק רק אם storageClass שצוין תומך בהרחבת נפח האחסון.
  • אי אפשר להקטין את הגודל של דיסק.

עדכון של תוכנית גיבוי

כל תוכנית גיבוי היא משאב Kubernetes. כדי לעדכן את ההגדרות שלו, מבצעים אחת מהפעולות הבאות:

  • עורכים את קובץ המניפסט של תוכנית הגיבוי ומחילים אותו מחדש.

  • משתמשים בפקודה kubectl patch.

לדוגמה, כדי להשהות תוכנית גיבוי פעילה, משנים את מאפיין paused של מניפסט התוכנית ל-true, ואז מחילים מחדש את המניפסט.

מחיקת תוכנית גיבוי

כדי למחוק תוכנית גיבוי ולהסיר את כל משאבי הגיבוי שלה, מריצים את הפקודה הבאה:

kubectl delete backupplan.alloydbomni.dbadmin.goog/BACKUP_PLAN_NAME -n NAMESPACE

מחליפים את מה שכתוב בשדות הבאים:

  • BACKUP_PLAN_NAME: השם של תוכנית הגיבוי שרוצים למחוק.

  • NAMESPACE: מרחב השמות של אשכול מסד הנתונים.

כדי להשהות תוכנית גיבוי בלי למחוק אותה, מגדירים את המאפיין paused של משאב תוכנית הגיבוי לערך true. תוכנית גיבוי מושהית ממשיכה לאחסן גיבויים ומאפשרת יצירת גיבוי ידני.