שיטות מומלצות לזמינות

בדף הזה מתוארות שיטות מומלצות להבטחת זמינות גבוהה של ההתקנה של Google Distributed Cloud במודל מחובר. השימוש ב-Distributed Cloud Connected לא כפוף להסכם רמת שירות (SLA), אלא רק ליעד למדידת רמת השירות (SLO) שמתואר בדף הזה.

בחירה והטמעה של רמת הזמינות

אתם צריכים לבחור את רמת הזמינות של עומסי העבודה המקושרים ב-Distributed Cloud שמתאימה ביותר לדרישות העסקיות שלכם. לדוגמה, לאפליקציה של קופה בשירות עצמי בחנות קמעונאית יש סיכון זמינות נמוך בהרבה מאשר לפריסת RAN בקצה של ספק רשתות סלולריות.

זמינות היעד פרופורציונלית ישירות לקיבולת המשאבים הרזרביים של Distributed Cloud שאתם שומרים למקרי חירום. הטבלה הבאה מתארת את הקשר הזה. ההערכות האלה לא כוללות את זמן ההשבתה המתוכנן עם חלון זמן לתחזוקה.

התוכנה של Distributed Cloud במודל מחובר צורכת חלק מהמשאבים בכל מכונה פיזית. הסכום משתנה בהתאם להגדרה הספציפית של הפריסה שלכם ב-Distributed Cloud במודל מחובר. ‫Google ממליצה לבצע בדיקת ביצועים (benchmark) של הפריסה שלכם ב-Google Distributed Cloud במודל מחובר כדי למדוד את הכמות הזו ולהביא אותה בחשבון כשמתכננים את חלוקת עומסי העבודה.

הקיבולת שנמצאת בשימוש קיבולת שמורה זמינות של טירגוט
‫66.6% 33.3% 99.9%

יכול להיות שתחוו ירידה פתאומית בקיבולת בגלל כשל בחומרה או בגלל צומת שנדרשת הפעלה מחדש. כדי להתכונן לכך, צריך לתכנן את עומסי העבודה תוך התחשבות במכסות המשאבים, כך שתמיד יהיה לכם קיבולת זמינה בכל צומת מחובר של Distributed Cloud שעומדת ברמת הזמינות שבחרתם.

גיוון גיאוגרפי של אזורי Distributed Cloud

כדי למזער את ההשפעה של תקלות פוטנציאליות במישור הניהול, מומלץ מאוד לפרוס את האזורים של Distributed Cloud בכמה אזורים סמוכים.

שימוש במצב זמינות

באשכולות של Distributed Cloud נעשה שימוש במישור בקרה מקומי שפועל בחומרה המחוברת של Distributed Cloud. עומסי העבודה ימשיכו לפעול גם אם החיבור ל- Google Cloud ינותק. מידע נוסף זמין במאמר בנושא מצב זמינות של Google Distributed Cloud במודל מחובר.

הסבר על עדכוני תוכנה וחלונות זמן לתחזוקה

‫Google מעדכנת באופן קבוע את התוכנה של Distributed Cloud במודל מחובר. עדכוני התוכנה האלה הם חובה ואי אפשר לבטל את ההסכמה להם. ‫Google Distributed Cloud במודל מחובר מאפשר לכם לציין חלונות תחזוקה נפרדים לכל אחד מהאשכולות שלכם ב-Google Distributed Cloud במודל מחובר.

כדי לצמצם שיבושים זמניים פוטנציאליים בעומסי העבודה, חלונות התחזוקה מאפשרים לכם לשלוט במועד שבו יכולים להתבצע שדרוגים אוטומטיים של מישורי בקרה וצמתים. חלונות זמן לתחזוקה שימושיים בין היתר בתרחישים הבאים:

  • שעות שבהן העומס נמוך: כדי לצמצם את הסיכוי להשבתה, כדאי לתזמן שדרוגים אוטומטיים לשעות שבהן העומס נמוך.
  • במהלך שיחה: כדאי לוודא שהשדרוגים יתבצעו במהלך שעות העבודה, כדי שמישהו יוכל לעקוב אחרי השדרוגים ולטפל בבעיות בלתי צפויות.
  • שדרוגים של כמה אשכולות: אתם רוצים לבצע שדרוגים בכמה אשכולות באזורים שונים, אחד בכל פעם במרווחי זמן מוגדרים.

‫Distributed Cloud Connected תומך בסוגים הבאים של חלונות תחזוקה:

  • חלון זמן לתחזוקה. מציינים חלון זמן שבמהלכו Google יכולה לבצע תחזוקה ושדרוגים של תוכנה באשכול המחובר שלכם ב-Distributed Cloud.
  • חלון זמן להחרגה מתחזוקה. מציינים חלון זמן שבמהלכו Google לא יכולה לבצע תחזוקה או שדרוגי תוכנה באשכול המחובר של Distributed Cloud. כדי להגדיר חלון זמן להחרגה מתחזוקה, צריך קודם להגדיר חלון זמן לתחזוקה. חלון זמן להחרגת תחזוקה מקבל עדיפות על פני חלון הזמן לתחזוקה של האשכול.

בנוסף לשדרוגים אוטומטיים, יכול להיות ש-Google תצטרך מדי פעם לבצע משימות תחזוקה אחרות. במקרים כאלה, המערכת תכבד את חלון זמן לתחזוקה של אשכול אם אפשר.

אם שדרוג תוכנה או משימת תחזוקה לא מסתיימים לפני סוף חלון הזמן לתחזוקה, Distributed Cloud connected משהה את השדרוג או את המשימה וממשיך אותם במהלך חלון הזמן הבא לתחזוקה שנקבע מראש. אם שדרוג התוכנה נכשל, השדרוג ב-Distributed Cloud Connected נעצר. במקרים כאלה צריך לפנות לתמיכה של Google כדי לתקן את התקנת התוכנה.

‫Distributed Cloud connected שומרת לעצמה את הזכות להשיק שדרוגים לא מתוכננים לשעת חירום מחוץ לחלונות התחזוקה. בנוסף, שדרוגים חובה מתוכנה שיצאה משימוש או מתוכנה לא עדכנית עשויים להתבצע באופן אוטומטי מחוץ לחלונות התחזוקה.

אפשר גם לשדרג את האשכול באופן ידני בכל שלב. שדרוגים שמתחילים באופן ידני מתחילים מיד ומתעלמים מחלונות תחזוקה.

במאמר הגדרת חלון זמן לתחזוקה מוסבר איך להגדיר חלון זמן לתחזוקה לאשכול חדש או קיים.

עדכון תוכנה מדורג

כדי לצמצם את זמן ההשבתה של עומסי העבודה, העדכונים של התוכנה המחוברת ל-Distributed Cloud מתבצעים בשלבים. במילים אחרות, Google משדרגת את צמתי העובדים בכל אשכול מחובר של Distributed Cloud בשלבים. כל צמתי העובדים בשלב של שדרוג תוכנה מושבתים בו-זמנית.

יש לכם גם אפשרות להגדיר את הגודל של שלב שדרוג התוכנה. במילים אחרות, אתם יכולים לציין את מספר הצמתים שיכולים להיות מושבתים בו-זמנית לצורך שדרוג תוכנה באשכול מחובר של Distributed Cloud. הוראות מפורטות זמינות במאמר בנושא ניהול זמן ההשבתה של צמתים במהלך שדרוגי תוכנה.

הגבלות

ההגבלות הבאות חלות על חלונות זמן לתחזוקה:

  • חלון זמן אחד לתחזוקה לכל אשכול. אפשר להגדיר רק חלון זמן לתחזוקה אחד לכל אשכול. הגדרת חלון זמן חדש לתחזוקה מחליפה את חלון הזמן הקודם.

  • אזורי זמן לחלונות זמן לתחזוקה. כשמגדירים חלונות לתחזוקה וצופים בהם, השעות מוצגות בצורה שונה בהתאם לכלי שבו משתמשים, כמו שמפורט בקטעים הבאים.

כשמגדירים חלונות לתחזוקה

כשמשתמשים בדגל --maintenance-window הכללי יותר כדי להגדיר חלון זמן לתחזוקה, אי אפשר לציין אזור זמן. כשמשתמשים ב-Google Cloud CLI או ב-API, השעות מוצגות לפי UTC. השעות במסוףGoogle Cloud מוצגות לפי אזור הזמן המקומי.

כשמשתמשים בדגלים מפורטים יותר, כמו --maintenance-window-start, אפשר לציין את אזור הזמן כחלק מהערך. אם לא מציינים את אזור הזמן, נעשה שימוש באזור הזמן המקומי. השעות תמיד נשמרות לפי שעון UTC.

כשצופים בחלונות זמן לתחזוקה

כשמציגים מידע על האשכול, חותמות הזמן של חלונות התחזוקה יכולות להיות מוצגות לפי שעון UTC או לפי אזור הזמן המקומי, בהתאם לאופן הצגת המידע:

  • כשמשתמשים במסוף Google Cloud כדי לראות מידע על האשכול, השעות תמיד מוצגות לפי אזור הזמן המקומי.
  • כשמשתמשים ב-CLI של gcloud כדי להציג מידע על האשכול, השעות תמיד מוצגות ב-UTC.

בשני המקרים, RRULE תמיד יהיה לפי שעון UTC. כלומר, אם מציינים, לדוגמה, ימים בשבוע, אז הימים האלה הם לפי שעון UTC.

הגדרת חלונות תחזוקה של אשכול

‫Distributed Cloud במודל מחובר מאפשר לכם לציין חלון זמן לתחזוקה לכל אחד מהאשכולות שלכם ב-Distributed Cloud במודל מחובר. בחלון הזה מציינים ל-Google לעדכן את תוכנת Distributed Cloud רק בזמן ובתדירות שאתם מציינים.

הכללים הבאים חלים על חלונות תחזוקה של אשכולות במודל מחובר של Distributed Cloud:

  • אם מציינים חלון זמן לתחזוקה לאשכול מחובר של Distributed Cloud, ‏ Google מעדכנת את התוכנה המחוברת של Distributed Cloud‏ 48 שעות אחרי שהעדכון הוכרז בהערות הגרסה של Distributed Cloud במודל מחובר. בדף הערות הגרסה, אפשר להירשם לפיד ה-RSS של הערות הגרסה המקושרות של Distributed Cloud כדי לקבל עדכונים על גרסאות חדשות של התוכנה.
  • משך הזמן המינימלי של חלון זמן לתחזוקה הוא חמש שעות. אתם יכולים לציין חלון זמן ארוך יותר בהתאם למורכבות של ההתקנה המחוברת של Distributed Cloud ולדרישות העסקיות שלכם.
  • התדירות המינימלית של עדכוני תוכנה היא פעם בשבוע. אפשר לציין חלונות תחזוקה שבועיים או יומיים. אפשר לכלול ולהחריג ימים ספציפיים.
  • אפשר לשנות את לוח הזמנים של חלון הזמן לתחזוקה של אשכול בכל שלב, אלא אם חלון הזמן לתחזוקה כבר תוכנן או אם חלון הזמן לתחזוקה נמצא בעיצומו.
  • אם עדכון התוכנה לא הושלם במהלך חלון הזמן שצוין, הוא מושהה ואז ממשיך במהלך חלון זמן לתחזוקה הבא שנקבע.

הוראות מפורטות זמינות במאמר בנושא הגדרת חלון זמן לתחזוקה לאשכול.

תיקון של חומרה שנכשלה

כש-Google מזהה כשל בחומרה של Distributed Cloud במודל מחובר, אנחנו מבצעים אחת מהפעולות הבאות:

  • במקרה של חומרה של Distributed Cloud בבעלות Google, ‏ Google מנסה לתאם ביקור באתר תוך שלושה ימי עסקים. כדי שטכנאי מורשה של Google יוכל לבצע את האבחון והתיקונים הנדרשים, צריך להעניק לו גישה לחומרה שמחוברת ל-Distributed Cloud.

  • במקרה של ציוד Distributed Cloud בבעלות הלקוח, Google תודיע לכם ול-SI המוסמך של Google על הבעיה. צריך לפנות אל איש ה-SI שסיפק את החומרה המחוברת של Distributed Cloud כדי לתאם ביקור של טכנאי ולבצע את האבחון והתיקונים הנדרשים.

אם יש כשל בציוד שמחובר ל-Distributed Cloud, ‏ Google או שותף SI מוסמך של Google מחליפים את המכונה כולה. לפני שהמכונה מוסרת מהמתחם שלכם, Google מוודאת שהנתונים שלכם נמחקו בצורה מאובטחת מכל הכוננים שלה.

נקודות כשל אחרות

אתם אחראים לתחזוקה של ההיבטים הבאים בהתקנה של Distributed Cloud, שלא נמצאים בשליטה של Google ויכולים להשפיע על הזמינות של Distributed Cloud במודל מחובר:

  • כל הנתונים שאתם בוחרים לאחסן בחומרה שמחוברת ל-Distributed Cloud. הפעולות האלה כוללות גיבויים מיותרים שפועלים וייצוא של הנתונים לפני החזרת הציוד המחובר ל-Distributed Cloud אל Google.
  • ספק כוח חשמלי.
  • טמפרטורת הסביבה, הלחות והקירור.
  • אבטחת חומרה פיזית.
  • אבטחת הרשת המקומית.
  • קישוריות לרשת המקומית ולאינטרנט. ‫Distributed Cloud connected צריך להתחבר מחדש אל Google Cloud כל 7 ימים כדי לרענן את אסימוני האבטחה, מפתחות ההצפנה ולסנכרן את נתוני הניהול והרישום ביומן.

המאמרים הבאים