יצירת מדיניות התראות עבור SLO
בדף הזה מוסבר איך ליצור מדיניות התראות ב-Cloud Monitoring ליעד למדידת רמת השירות (SLO) שיוצרים ב-Cloud Service Mesh.
סקירה כללית על יעדים למדידת רמת השירות (SLO)
Cloud Monitoring יכול להפעיל התראה כששירות עומד להפר הסכם רמת שירות (SLO). אתם יכולים ליצור מדיניות התראות על סמך קצב הניצול של תקציב השגיאות. לכל ההתראות על תקציבי שגיאות יש את אותו תנאי בסיסי: אחוז מסוים של תקציב השגיאות עבור תקופת התאימות נצרך בתקופת מבט לאחור, שהיא תקופת זמן, כמו 60 הדקות האחרונות. כשיוצרים מדיניות התראות, Cloud Service Mesh מגדיר באופן אוטומטי את רוב התנאים להתראה על סמך ההגדרות ב-SLO. אתם מציינים את תקופת המבט לאחור ואת אחוז הצריכה.
כדי לקבוע אילו ערכים כדאי להגדיר לתקופת מבט לאחור ולאחוז הצריכה, יכול להיות שתצטרכו לנסות כמה אפשרויות. אפשר להשתמש בתקופת ההסתכלות לאחור שמוגדרת כברירת מחדל (60 דקות) כנקודת התחלה. כדי לקבוע את אחוז הצריכה, צריך לעקוב אחרי התנהגות השירות ולראות איזה אחוז מתוך תקציב השגיאות הכולל (במהלך תקופת התאימות) נצרך ב-60 הדקות האחרונות. אתם רוצים להגדיר את אחוז הצריכה כך שלא תנצלו יותר מדי מתקציב השגיאות בתקופת מבט לאחור ממה שאתם יכולים להרשות לעצמכם, אבל לא רוצים להפעיל התראה שלא לצורך.
לדוגמה, נניח שיצרתם SLO עם השם הבא:
95% < 300ms Latency in Calendar Week
בהתאם ליעד הזה, רק ל-5% מהבקשות הכוללות בשבוע יכול להיות זמן אחזור של יותר מ-300 אלפיות השנייה. אם שיעור השגיאות מגיע ל-5% או חורג ממנו, תקציב השגיאות הכולל מנוצל. אם מגדירים את תקופת המבט לאחור לשעה אחת, כל תקופת מבט לאחור היא 1/168 מתקופת התאימות (יש 168 שעות בשבוע). כדי לחשב את אחוז הצריכה השעתי שלא חורג מתקציב השגיאות הכולל לשבוע:
5% ÷ 168 ≈ 0.03%
השיהוי בשירות יכול להשתנות בהתאם לעומס או לתנאים אחרים, ולכן הגדרת אחוז הצריכה ל-0.03% עלולה להפעיל התראות שלא לצורך. אפשר להתחיל עם ערך כפול מזה, או 0.06%, ואז לעקוב אחרי השירות ולהתאים את הערך לפי הצורך.
לפני שמתחילים
יוצרים SLO לאחד השירותים.
יצירת מדיניות התראות על SLO
עוברים לכרטיסייה Health (תקינות) של שירות:
במסוף Google Cloud , עוברים אל Cloud Service Mesh.
בוחרים את Google Cloud הפרויקט מהרשימה הנפתחת בסרגל התפריטים.
לוחצים על השירות שעבורו רוצים ליצור מדיניות התראות.
בסרגל הניווט הימני, לוחצים על Health (תקינות).
לוחצים על יעד רמת השירות (SLO) שרוצים ליצור עבורו מדיניות התראות.
בקטע Current Status of SLO (הסטטוס הנוכחי של SLO) משמאל, לוחצים על הקישור Create Alerting Policy (יצירת מדיניות התראות).
מופיעה תיבת הדו-שיח הוספת תנאי. Cloud Service Mesh מאכלס אוטומטית את התנאי SLO Burn Rate על סמך ההגדרות ב-SLO. אתם מגדירים את התנאי SLO Burn Rate כדי לקבל התראה כשהירידה בתקציב השגיאות של ה-SLO מהירה מדי. חשוב לוודא שתקבלו התראה לפני שה-SLO יחרוג מתקציב השגיאות.

מגדירים את התנאי:
- כדי לתת שם לתנאי, לוחצים על הקישור שם מוצע כדי להשתמש בשם שמבוסס על יעד רמת השירות, או מזינים שם לתנאי.
- בקטע יעד, מזינים את תקופת המבט לאחור בשדה משך המבט לאחור או משתמשים בערך ברירת המחדל.
- בקטע Configuration (הגדרה), מזינים את אחוז הצריכה בשדה Threshold (סף).
- לוחצים על Save. מופיע החלון Create new alerting policy (יצירת מדיניות התראות חדשה).
מגדירים את מדיניות ההתראות:
- מזינים שם למדיניות.
- התנאי מאוכלס באופן אוטומטי, אבל אפשר להוסיף עוד תנאי.
- אם למדיניות ההתראה יש רק תנאי אחד, משאירים את ערך ברירת המחדל כל התנאים מתקיימים בשדה הפעלת המדיניות.
- אפשר גם להגדיר את הקטעים התראות ותיעוד. מידע נוסף זמין במאמר בנושא ניהול מדיניות התראות.
- לוחצים על Save. יוצג הדף פרטי מדיניות.
- כדי לחזור ללוח הבקרה Cloud Service Mesh, לוחצים על תפריט הניווט dehaze ועוברים אל Anthos > Services.
המאמרים הבאים
מידע נוסף על התראות מ-Site Reliability Engineering ב-Google: