הדף הזה רלוונטי ל-Apigee ול-Apigee Hybrid.
לעיון במסמכי התיעוד של
Apigee Edge
Apigee היא פלטפורמה מבוססת-ענן עם ריבוי דיירים ושירות עצמי, שפועלת בתצורה עם יתירות מלאה (פעילה/פעילה) בכמה מרכזי נתונים בכמה אזורים בעולם. פלטפורמת Apigee מבוססת על ענן Google Cloud. כחלק מהשירותים שאנחנו בונים ב-Google Cloud, אנחנו משתמשים בכמה מרכזי נתונים בכל אזור ומספקים תנועה בזמן אמת ללקוחות שלנו בכמה מרכזי נתונים. אין לנו מרכז נתונים 'פעיל' ומרכז נתונים 'המתנה' (או 'משני' או 'יתירות כשל'). יש לנו שני מרכזי נתונים (או יותר) שמשרתים באופן קבוע ובו-זמני את תעבורת הלקוחות בכל אזור בעולם.
BCP/DR plan
התוכנית להמשכיות עסקית (BCP) ולשחזור לאחר אסון (DR) של Apigee היא תוכנית ברמת הפלטפורמה, ולא מכילה משימות מפורטות ללקוחות פרטיים. במקום זאת, הפלטפורמה מוגדרת לעבד בקשות לנתוני לקוחות ללא קשר לשיבושים ולהפסקות. הנתונים ימשיכו לזרום גם אם מרכז נתונים שלם יהיה אופליין. אם אזור שלם יצא משימוש, לקוח שמשתמש באזור יחיד עלול לחוות הפסקה זמנית בשירות של עיבוד API. ללקוחות שמחפשים שירותים עם יתירות גבוהה יותר מאשר "באזור", שירות Apigee זמין ברמה של יתירות גלובלית של מרכזי נתונים, שבה אפשר לטפל בתנועת הנתונים בכמה אזורים או מדינות. כך שאם אזור שלם יצא מכלל פעולה, הנתונים עדיין יזרמו.
שירותים ללקוחות באזור יחיד לא מועברים אוטומטית לאזור אחר בגלל הגבלות גיאוגרפיות אפשריות על עיבוד נתונים וגישה אליהם. שירותי Apigee מתארחים עבור לקוחות באזור שזוהה על ידי הלקוח. יכול להיות שיש תקנות ספציפיות או התחייבויות של הלקוחות כלפי המשתמשים שלהם בנוגע למיקומים גיאוגרפיים של נתונים, ולכן השירותים לא יועברו אוטומטית לאזור חלופי. הסיבה לכך היא שהעברה כזו עלולה לפגוע בהתחייבויות של Google כלפי הלקוחות שלה או בהתחייבויות של הלקוחות של Google כלפי הלקוחות שלהם.
Google לא משתפת את התוכנית המלאה של BCP/DR עם אף לקוח פרטי, כי היא מכילה מידע רגיש פנימי והפניות ללקוחות שלנו. מדיניות הפרטיות שלנו אוסרת לשתף את תוכנית ה-BCP/DR של הפלטפורמה עם לקוחות פרטיים, כי היא עלולה לחשוף שמות של לקוחות אחרים. אנחנו מציעים את אותה רמת פרטיות לכל לקוח.
ניהול BCP/DR
צוות אבטחת המידע של Google אחראי על הפיקוח על תוכנית חוסן העסקים, ומפקד אירוע מתחלף אחראי על הניהול והפתרון של כל האירועים. מפקד האירוע יכול להזמין בכל רגע אנשי תפעול והנדסה, ויש לו תוכניות פעולה לכל הפעולות שעשויות להידרש.
בדיקות BCP/DR
Google מבצעת תהליכים תפעוליים שתומכים בבדיקות BCP/DR של הפלטפורמה בתדירות גבוהה יותר מהבדיקות השנתיות המלאות של BCP/DR. מדי חודש אנחנו מבצעים שינויים בעומס מהסביבה הפעילה שלנו בזמן שאנחנו מבצעים עדכונים במערכות שמריצות את השירות. התהליך הזה כולל השבתה של מערכות בשווי של מרכז נתונים שלם, בזמן שעומס העבודה מטופל על ידי מרכז הנתונים המקביל. במהלך התהליך הזה, אחרי ביצוע העדכונים, מרכז הנתונים הראשון מופעל מחדש והשירותים מופעלים בשידור חי או מחדש כדי לוודא שלא נוצרו בעיות. לאחר מכן, מרכז הנתונים של העמית מושבת לצורך אותם עדכונים, ואז מופעל מחדש. Google משתמשת בכלים ובטכניקות כדי להפחית את תעבורת הנתונים ולשלוח אחוז קטן של תעבורת נתונים לשירותים שעודכנו לאחרונה, כדי לבדוק אם יש בעיות או שגיאות לפני שחוזרים לעיבוד של עומס מלא.
תהליך התפעול העקבי הזה עולה על התקן בתעשייה של 'בדיקה' דו-שנתית של עמידות השירות שלנו, והופך את הבדיקה למשימה תפעולית שמתבצעת בתדירות גבוהה יותר.
בנוסף לתהליכי התפעול שמתוארים למעלה, Google גם מבצעת תרגילי BCP/DR לפחות פעם בשנה, שבהם חברים בצוותי ההנדסה והתפעול בודקים תרחיש אמיתי של אסון. הדבר מספק הכשרה וניסיון נוספים לצוות שלנו בתוכניות BCP/DR הגדולות יותר שלנו לארגון כולו, בנוסף לשירות עצמו.
בבדיקות של תוכניות להמשכיות עסקית (BCP) ולשחזור מאסון (DR) ש-Google מבצעת, לא נעשה שימוש ב'תרגילים למעבר לגיבוי' או ב'מיקומים משניים' כי כל הפעולות האלה מובנות במערכת הפעילה.
Google מנהלת Playbooks לשימוש של כל צוותי התפעול וההנדסה. המדריכים האלה נבדקים ומעודכנים לפחות פעם בשנה, ומשמשים אותנו בכל הבדיקות והתרגילים של BCP/DR.
לקוחות יכולים לקבל דוחות שנתיים של בדיקות BCP/DR. אנחנו גם משתפים את התוצאות של המשימות התפעוליות שלנו ואת דוחות הבדיקה של תרגיל ה-DR השנתי עם מבקרי צד שלישי, והם מהווים את הבסיס לבדיקה של המבקר בנוגע לתאימות שלנו ל-PCI, ל-HIPAA, ל-ISO, לדרישות חוזיות ולדרישות אחרות.
בדיקות BCP/DR של לקוחות
מומלץ ללקוחות לשלב את שירותי Apigee בתוכניות שלהם להתאוששות מאסון. הלקוחות יכולים וצריכים לשקול איך Apigee יכול להפנות תנועה לפי הצורך כדי שהלקוחות יוכלו לשמור על שירותי משתמשי הקצה גם במהלך הפסקה זמנית בשירות במרכז נתונים של לקוח או אירוע אסון אחר. עם זאת, רמת הבדיקה הזו לא נכללת בתוכנית ה-DR של Apigee. אנחנו ממליצים ללקוחות לבצע בדיקות של תוכניות להמשכיות עסקית (BCP) והתאוששות מאסון (DR) באפליקציות שלהם, ולכלול את Apigee בבדיקה.
RTO/RPO
Apigee לא מציעה יעדי נקודת שחזור ויעדי זמן שחזור (RPO/RTO) ללקוחות או בחוזים שקשורים לפעילויות של BCP/DR. הסכמי SLA הם המקבילה בענן לנקודות הנתונים של RTO/RPO. מכיוון ש-Apigee הוא שירות מבוסס-ענן עם יתירות, שכולל גם שירותי ניהול וגם שירותי זמן ריצה, שתוכננו עם שירותים פעילים עם יתירות, אפשר לראות את RTO ו-RPO כ'זמן אמת'. לקוחות באזור יחיד מקבלים שירותים מיותרים לפחות במרכזי נתונים שונים באותו אזור. לקוחות שרוצים רמות גבוהות יותר של יתירות יכולים לבחור בשירותים מרובי-אזורים.
תוכנית למקרה של פנדמיה
Google כוללת תוכנית למקרה של פנדמיה כחלק מהתוכנית הכוללת של BCP/DR והתהליכים. Google מפעילה צוות תמיכה גלובלי מסביב לשעון, 7 ימים בשבוע, במשרדים שונים ובמיקומים מרוחקים, כדי לתת מענה לפעולות עסקיות כמו תמיכה. אם מגפה באזור מסוים בכדור הארץ משפיעה על אחד ממוקדי התמיכה שלנו, הצוות במשרדים אחרים יקבל התראה ויכסה את המשמרות שבדרך כלל מטופלות על ידי המשרד שנפגע. במקרה של שירותים עסקיים אחרים, כמו מכירות, כוח העבודה מפוזר ברחבי העולם. כל הצוותים ב-Google מוכנים לעבודה מרחוק אם יש צורך בכך. הכלים שבהם נעשה שימוש מבוססים על ענן, ולכן הם מתאימים באופן טבעי לתוכנית תגובה למגפה.
עדכונים
Google בודקת ומעדכנת את תוכנית ה-BCP/DR לפחות פעם בשנה. המידע שנאסף מאירועים, שינויים במוצר, סטנדרטים בתעשייה, פעילויות של ניתוח סיכונים ובדיקות של BCP/DB משמש לעדכון התוכנית.
ניתוח השפעה על העסק והערכות סיכונים
Google עורכת ניתוח של ההשפעה העסקית והערכת סיכונים מדי שנה. התוצאות של ה-BIA וה-RA מקבלות עדיפות ומתועדות במערכת למעקב אחר בעיות.