במסמך הזה מפורט מידע על כלים וטכניקות לשחזור אחרי אסון, שיעזרו לכם להגן על הנתונים מפני אובדן והשבתה.
תכונות של Spanner להתאוששות מאסון
Spanner נועד להיות ניתן להרחבה ומבוזר ברחבי העולם. Spanner מציע את התכונות הבאות כדי להבטיח זמינות גבוהה של הנתונים:
הגדרות של מספר אזורים: כדי להבטיח את זמינות הנתונים גם אם אזור או אזורים נכשלים, Spanner יכול לשמור עותקים של הנתונים באזורים נפרדים בתוך אזור יחיד או במספר אזורים.
הגנה מפני מחיקת מסד נתונים: אתם יכולים להגן על מסדי נתונים קיימים מפני מחיקה מקרית על ידי משתמשים או חשבונות שירות שיש להם את ההרשאות הנדרשות לניהול זהויות והרשאות גישה (IAM) למחיקת מסד הנתונים.
גיבוי ושחזור של מסד נתונים: אפשר ליצור גיבויים של מסדי נתונים ב-Spanner ולשחזר אותם כדי להגן מפני שגיאות של מפעילים ואפליקציות. כל הגיבויים עם זמינות גבוהה, מוצפנים ואפשר לשמור אותם למשך שנה ממועד היצירה שלהם. אתם יכולים ליצור גיבויים מלאים לפי דרישה או באמצעות לוח זמנים לגיבוי. אפשר ליצור גיבויים מצטברים רק באמצעות לוח זמנים לגיבוי.
ייצוא וייבוא: אפשר לייצא מסדי נתונים של Spanner ל-Cloud Storage בפורמט CSV או Avro.
שחזור לנקודת זמן (PITR): שחזור לנקודת זמן (PITR) ב-Spanner מספק הגנה מפני פגיעה לוגית בנתונים, ומפני מחיקה או כתיבה של מסד נתונים בטעות. לדוגמה, אם מפעיל כותב נתונים בטעות או שהפעלת אפליקציה משחיתה את מסד הנתונים, אפשר לשחזר את הנתונים מנקודת זמן בעבר (עד 7 ימים).
העתקה בין אזורים: אתם יכולים להעתיק גיבויים לאזורים גיאוגרפיים שונים כדי להגן על הנתונים מפני כשלים אזוריים או כדי לעמוד בדרישות התאימות של הארגון.
בחירה בין גיבוי של מסד הנתונים לבין ייצוא שלו
כדאי להשוות בין גיבוי של מסדי נתונים לבין ייצוא של מסדי נתונים לפני שמחליטים באיזו אפשרות להשתמש. לדוגמה, תקופת השמירה של גיבויים יכולה להיות עד שנה אחת. אם רוצים תקופת שמירה ארוכה יותר משנה, אפשר לייצא את מסד הנתונים. בטבלה הבאה מתוארים הדמיון וההבדלים בין שימוש בגיבוי ושחזור לבין שימוש בייבוא ובייצוא:
| גיבוי ושחזור | ייבוא וייצוא | |
|---|---|---|
| עקביות הנתונים | הגיבויים ומסדי הנתונים המיוצאים עקביים מבחינת טרנזקציות וחיצונית. | |
| השפעה על הביצועים | לגיבויים אין השפעה על הביצועים של מופע. Spanner מבצע גיבויים באמצעות משימות ייעודיות שלא משתמשות במשאבי השרת של מופע. | כדי למזער את ההשפעה על ביצועי מסד הנתונים, מייצאים את ההרצות כמשימה בעדיפות בינונית. מידע נוסף זמין במאמר בנושא עדיפות למשימות. |
| פורמט האחסון | הפורמט מוצפן וקנייני, ומיועד לשחזור מהיר. | תמיכה בפורמטים של קבצים CSV ו-Avro. |
| ניידות | אתם יוצרים גיבויים באותו מופע שבו נמצא מסד הנתונים של המקור. אחרי שיוצרים גיבוי, אפשר להעתיק את הגיבוי למופע באזור או בפרויקט אחרים, אם אתם צריכים גיבוי חוצה אזורים או חוצה פרויקטים. אחר כך תוכלו לשחזר מגיבוי כמסד נתונים חדש לכל מופע באותו פרויקט. למכונה שאליה אתם משחזרים צריך להיות אותו הגדרות מכונה כמו למכונה שבה מאוחסן הגיבוי. |
מסדי הנתונים המיוצאים נמצאים ב-Cloud Storage, ואפשר להעביר את הנתונים לכל מערכת שתומכת ב-CSV או ב-Avro. |
| שמירה | אפשר לשמור גיבויים למשך עד שנה. | מסדי נתונים מיוצאים מאוחסנים ב-Cloud Storage, שם הם נשמרים כברירת מחדל עד שהם נמחקים. אתם יכולים להתאים אישית את מדיניות מחזור החיים והשמירה. |
| תמחור | החיוב על הגיבויים מתבצע בפרויקט Spanner על סמך נפח האחסון שנעשה בו שימוש לכל יחידת זמן. פרטים נוספים מופיעים בקטע תמחור. | החיוב על ייבוא וייצוא הוא מורכב יותר כי הוא כולל שימוש ב-Cloud Storage וב-Dataflow. מידע נוסף זמין במאמר תמחור של ייצוא וייבוא מסדי נתונים. |
| זמן השחזור | השחזור מתבצע בשתי פעולות: שחזור ואופטימיזציה. פעולת השחזור מציעה זמן מהיר עד לבית הראשון, כי מסד הנתונים מטמיע את הגיבוי ישירות בלי להעתיק את הנתונים. אחרי שפעולת השחזור מסתיימת, מסד הנתונים מוכן לשימוש, אבל יכול להיות שזמן האחזור של הקריאה יהיה קצת יותר גבוה בזמן האופטימיזציה. מידע נוסף זמין במאמר הסבר על תהליך השחזור. | הייבוא איטי יותר. צריך לחכות עד שכל הנתונים ייכתבו במסד הנתונים. |
טכניקות להתאוששות מאסון
Spanner מציע טכניקות להתאוששות מאסון (DR) כדי להגן על הנתונים שלכם מפני האסונות הבאים:
- כשלים אזוריים: הגדרת אזור ב-Spanner מספקת הגנה אוטומטית מפני כשלים אזוריים, וכך מבטיחה שאם אזור אחד בתוך אזור נכשל, האפליקציה שלכם תמשיך לפעול.
- כשל אזורי: אם האפליקציה שלכם דורשת זמינות גבוהה יותר של נתונים והגנה מפני כשלים אזוריים, כדאי להשתמש בהגדרות של מספר אזורים שמציעות זמינות של 99.999%.
- אסונות גיאוגרפיים גדולים: כדאי להשתמש בעותק גיבוי חוצה אזורים של Spanner כדי שהגיבויים יהיו זמינים באזורים שונים.
- שיבוש לוגי: כדי להתמודד עם שיבוש לוגי, אפשר להשתמש בטכניקות הבאות לשחזור נתונים במקרה של אסון (DR) לתקופות שמירה שונות:
- מגדירים שחזור לנקודת זמן (PITR) כדי לשחזר את הנתונים בכל נקודת זמן ב-7 הימים האחרונים.
- מגדירים לוח זמנים לגיבוי שיוצר גיבויים מלאים או גיבויים מצטברים בתדירות שעונה על הדרישות שלכם. אפשר לשמור את כל הגיבויים למשך עד שנה.
- ייצוא מסד הנתונים ל-Cloud Storage, שבו אפשר לשמור את הנתונים לצורך תאימות, ניתוח או דיווח.
- מחיקה לא מכוונת של מסד נתונים: כדי למנוע מחיקה לא מכוונת של מסדי נתונים קיימים על ידי משתמשים או חשבונות שירות שיש להם את הרשאות ה-IAM הנדרשות, אפשר להשתמש בהגנה מפני מחיקה של מסד נתונים.
אופטימיזציה של העלויות של תוכנית ההתאוששות מאסון
אפשר לבצע אופטימיזציה של העלויות של תוכנית התאוששות מאסון (DR) ב-Spanner בדרכים הבאות:
- הגדרות במספר אזורים: השתמשו בהגדרות במספר אזורים רק לאפליקציות שנדרשת בהן זמינות של 99.999%. אם יש לכם אפליקציות שדורשות השהיות לקריאה בלבד, כדאי לשקול שימוש בעותקים לקריאה באזורים אחרים.
- תדירות הגיבוי: כדאי לתזמן גיבויים רק בתדירות הנדרשת כדי לעמוד בדרישות.
- סוג הגיבוי: כדי לחסוך בעלויות האחסון, כדאי להשתמש בגיבוי מצטבר.
- שמירת גיבויים: קובעים ומגדירים את תקופת השמירה של הגיבויים למשך הזמן הקצר ביותר שנדרש כדי לעמוד בדרישות השחזור והתאימות.
- ייצוא נתונים בכמות גדולה: מומלץ להשתמש ב-Spanner Data Boost for Spanner לייצוא נתונים בכמות גדולה כדי להפחית עומס ממשאבי מחשוב מהמופע שלכם ולמנוע השפעה שלילית על ביצועי העסקאות.
בדיקה של תוכנית התאוששות מאסון (DR)
כדאי לבדוק ולאמת את הרכיבים הבאים בתוכנית ההתאוששות מאסון (DR):
- מדמים את האירועים הסבירים ביותר שעלולים לגרום לאובדן נתונים בארגון.
- מומלץ לתרגל שחזור של מסדי נתונים מגיבוי שיצרתם. מידע נוסף על שחזור מסד הנתונים זמין במאמר סקירה כללית על שחזור.
- הערכת ההשפעה של תוכנית ההתאוששות מאסון על ניצול האחסון.
- הערכת ההשפעה של תהליכי הגיבוי על ביצועי האפליקציה.
- מדמים כשל אזורי או כשל באזור כדי לבדוק את הליך יתירות הכשל והשחזור.
המאמרים הבאים
- תרחישי כשל ועמידות ב-Spanner
- סקירה כללית בנושא גיבויים
- יצירת גיבויים
- יצירה וניהול של לוחות זמנים לגיבוי
- סקירה כללית של PITR