סקירה כללית על התראות

במאמר הזה נסביר איך לקבל התראות כשהאפליקציה נכשלת או כשהביצועים שלה לא עומדים בקריטריונים שהוגדרו.

איך פועלות ההתראות

תהליך ההתראות ב-Cloud Monitoring כולל שלושה חלקים:

  • מדיניות התראות, שמתארת את הנסיבות שבהן רוצים לקבל התראה ואת האופן שבו רוצים לקבל התראה על אירוע. מדיניות ההתראות יכולה לעקוב אחרי נתונים של סדרות זמן שאוחסנו על ידי Monitoring או אחרי יומנים שאוחסנו על ידי Cloud Logging. כשהנתונים האלה עומדים בתנאי של מדיניות ההתראות, מערכת Monitoring יוצרת אירוע ושולחת את ההתראות.

  • כל אירוע הוא רשומה של סוג הנתונים שנבדקו ושל הזמן שבו התנאים התקיימו. המידע הזה יכול לעזור לכם לפתור את הבעיות שגרמו לתקרית.

  • ערוץ התראות מגדיר איך תקבלו התראות כש-Monitoring יוצר אירוע. לדוגמה, אפשר להגדיר מדיניות התראות לשליחת אימייל לכתובת my-support-team@example.com ולפרסום הודעה בערוץ #my-support-team ב-Slack. מדיניות התראות יכולה להכיל ערוץ אחד או יותר של הודעות.

מדיניות התראות יכולה להעריך שלושה סוגים של נתונים:

  • נתונים של סדרות זמן, שנקראים גם נתוני מדדים, שמאוחסנים על ידי Monitoring. סוגי המדיניות האלה נקראים מדיניות התראות מבוססת-מדדים.

    כדי ללמוד איך מגדירים מדיניות התראות שמבוססת על מדדים, אפשר לנסות את המדריך למתחילים בנושא Compute Engine.

  • נתונים של רשומות ביומן שאוחסנו על ידי Cloud Logging. מדיניות התראות שמעריכה רשומות בודדות ביומן נקראת מדיניות התראות מבוססת-יומן. מדיניות התראות שמבוססת על יומנים שולחת לכם התראות כשמופיעה הודעה מסוימת ביומנים. מידע נוסף מופיע במאמר בנושא מעקב אחרי היומנים.

  • התוצאות של שאילתת SQL שמופעלת ב-Log Analytics על נתוני רשומות ביומן שמאוחסנים ב-Logging. מדיניות התראות שעוקבת אחרי התוצאות של שאילתת SQL נקראת מדיניות התראות שמבוססת על SQL. מידע נוסף מופיע במאמר בנושא מעקב אחרי תוצאות של שאילתות SQL באמצעות מדיניות התראות.

    מדיניות התראות מבוססת-SQL נמצאת ב-Public Preview.

תהליך ההתראה עוזר לכם להגיב לבעיות כשהביצועים של אפליקציה לא עומדים בערכים המקובלים. לדוגמה, אתם פורסים אפליקציית אינטרנט במכונה וירטואלית (VM) של Compute Engine. אתם מצפים שזמן האחזור של תגובת ה-HTTP ישתנה, אבל אתם רוצים שצוות התמיכה יגיב אם זמן האחזור של האפליקציה יהיה גבוה במשך תקופה משמעותית. אפשר ליצור מדיניות התראות שמבוססת על מדדים ועוקבת אחרי מדד השהייה של תגובת ה-HTTP של האפליקציה. אם זמן האחזור של התגובה גבוה משתי שניות למשך חמש דקות לפחות, מערכת המעקב יוצרת אירוע ושולחת התראות באימייל לצוות התמיכה שלכם.

איך יוצרים מדיניות התראות

יש כמה דרכים ליצור מדיניות התראות. לדוגמה, אתם יכולים להשתמש במדיניות התראות שהוגדרה מראש על ידי הפעלת התראות מומלצות משילובים או מדפים מסוימים במסוף Google Cloud . אפשר גם להגדיר מדיניות חדשה להתראות באמצעותGoogle Cloud המסוף, Cloud Monitoring API, ‏ Google Cloud CLI ו-Terraform.

שימוש בשילובים ובכללי מדיניות מומלצים להתראות

‫Monitoring מספק חבילות מוכנות מראש שמאפשרות ליצור מדיניות התראות עבורGoogle Cloud השירותים והשילובים של צד שלישי. החבילות כוללות מדיניות מומלצת להגדרת התראות, מרכזי בקרה לדוגמה ומדדים מרכזיים לשירות. החבילות האלה זמינות לGoogle Cloud שירותים כמו Google Kubernetes Engine,‏ Compute Engine ו-Cloud SQL, ולשילובים נפוצים של צד שלישי כמו MongoDB,‏ Kafka ו-Elasticsearch.

כשמתקינים חבילה, אפשר להפעיל את מדיניות ההתראות המומלצת של החבילה. כשמפעילים מדיניות התראות מומלצת, מגדירים את ערוץ ההתראות שלה ואפשר גם לשנות ערכים אחרים. אחרי ההגדרה, מדיניות ההתראות מתחילה לעקוב אחרי היעד שלה באופן מיידי, בלי שנדרש קלט של משתמשים נוסף.

מדיניות מומלצת להתראות שימושית כשפורסים שירות חדש ורוצים לקבל התראות על מדדים חשובים. לדוגמה, חבילת השילוב של Cloud SQL כוללת מדיניות מומלצת להגדרת התראות לגבי מקרים של מופעים שנכשלו ועסקאות איטיות:

שניים מכללי המדיניות המומלצים להתראות בחבילת השילוב של Cloud SQL.

מידע נוסף על שילובים של התראות זמין במאמר מעקב אחרי אפליקציות של צד שלישי.

יצירת כללי מדיניות חדשים להתראות

אתם יכולים ליצור מדיניות התראות כדי לעקוב אחרי סוגים שונים של נתונים, בהתאם לצרכים שלכם. בקטעים הבאים מפורטים סוגי הנתונים השונים שאפשר לעקוב אחריהם באמצעות מדיניות התראות.

מעקב אחרי נתונים של פעולות על ציר הזמן

סוג התנאי תיאור דוגמה
תנאי של סף מדד

תנאי סף המדד מתקיימים כשערכי המדד גבוהים או נמוכים מסף מסוים בחלון בדיקה מחדש ספציפי.

מידע נוסף זמין במאמרים יצירת מדיניות התראות מבוססת-מדדים ויצירת מדיניות התראות באמצעות ה-API.

אתם רוצים מדיניות התראות שתשלח התראה כשהשהיית התגובה היא 500ms או יותר, במשך חמש בדיקות זמני פעילות רצופות במהלך 10 דקות.
תנאי של היעדר מדד

התנאים של היעדר מדד מתקיימים כשבסדרת זמן במעקב אין נתונים בחלון בדיקה חוזרת ספציפי. חלון הבדיקה מחדש המקסימלי הוא 23.5 שעות.

מידע נוסף זמין במאמרים בנושא יצירת מדיניות התראות על היעדר מדדים ויצירת מדיניות התראות באמצעות ה-API.

אתם רוצים מדיניות התראות שפותחת אירוע בצוות התמיכה שלכם אם משאב לא מגיב לבקשות HTTP במשך חמש דקות.
תנאי של ערך מדד חזוי

תנאים של ערכי מדדים חזויים מתקיימים כשהמדיניות ליצירת התראות חוזה שהסף ייחצה בחלון התחזית הקרוב. אפשר להגדיר חלון זמן של שעה אחת עד 7 ימים.

מידע נוסף זמין במאמרים יצירת מדיניות התראות מבוססת-ערכי מדדים צפויים ויצירת מדיניות התראות באמצעות ה-API.

אתם רוצים מדיניות התראה שפותחת אירוע בצוות התמיכה שלכם כשסביר להניח ששימוש במשאב יגיע ל-80% משטח הדיסק ב-24 השעות הקרובות.

מעקב אחר נתוני רשומות ביומן

כדי לעקוב אחרי רשומות ספציפיות ביומן, משתמשים במדיניות התראות שמבוססת על יומן. תנאי במדיניות התראות מבוססת-יומן מתקיים כשמדיניות ההתראות מזהה שצירוף מילים מרשומה ביומן תואם לקריטריונים של מדיניות ההתראות. לדוגמה, אתם רוצים מדיניות התראות שפותחת אירוע בצוות התמיכה שלכם כשערך של רשומה ביומן message מכיל product_ids=['tier_1_support', 'tier_2_support'].

מידע נוסף זמין במאמר בנושא הגדרת מדיניות התראות שמבוססת על יומנים במסמכי התיעוד בנושא Logging.

מעקב אחרי תוצאות של שאילתות SQL

כדי לעקוב אחרי תוצאות של שאילתות SQL, משתמשים במדיניות התראות שמבוססת על SQL. התנאי של מדיניות התראות מבוססת-SQL מנתח מעת לעת את נתוני רשומות היומן, ואז יוצר אירועים כשטבלת תוצאות השאילתה עומדת בקריטריונים מסוימים. סוג המדיניות הזה של התראות שימושי כשצריך מדיניות התראות שעוקבת אחרי צבירות של נתונים או אחרי דפוסים מורכבים בכמה רשומות ביומן. לדוגמה, אתם רוצים לקבל התראה אם יותר מ-50 רשומות ביומן ב-60 הדקות האחרונות הן ברמת חומרה WARNING.

מידע נוסף זמין במאמר בנושא מעקב אחרי תוצאות של שאילתות SQL באמצעות מדיניות התראות במסמכי התיעוד של Logging.

הרכיבים של מדיניות ההתראות

כל מדיניות התראות כוללת את הרכיבים הבאים:

  • תנאי שמתאר מתי משאב או קבוצת משאבים נמצאים במצב שמחייב תגובה. התנאי כולל את מקור הנתונים, סף סטטי או דינמי ושיטות צבירת נתונים כמו מסננים ו-groupby. התנאים יכולים לעקוב אחרי מדד יחיד, כמה מדדים או יחס בין מדדים. אפשר גם להשתמש בשפת השאילתות של Prometheus‏ (PromQL) כדי לכלול ביטויים מורכבים כמו ספים דינמיים ולוגיקה מותנית.

    אם משתמשים בשילוב כדי להפעיל מדיניות מומלצת להתראות, אז התנאי של מדיניות ההתראות מאוכלס מראש.

  • רשימה של ערוצי התראות שמתארת למי לשלוח התראה כשנדרשת פעולה. מידע נוסף זמין במאמר בנושא יצירה וניהול של ערוצי התראות.

  • תיעוד שמופיע בהתראות ובדפי אירועים. אתם יכולים להגדיר את שורת הנושא של ההתראה, ולהוסיף מידע שימושי לגוף ההתראה. לדוגמה, אתם יכולים להגדיר שההתראה תציג קישורים לחוברות הפעלה פנימיות או לדפי Google Cloud כמו מרכזי בקרה בהתאמה אישית. למידע נוסף על תיעוד, כולל דוגמאות, אפשר לעיין במאמר הוספת הערות לאירועים עם תיעוד שמוגדר על ידי המשתמש.

שפות שאילתות

אתם יכולים להשתמש בשפת השאילתות של Prometheus‏ (PromQL) ובמסננים במדיניות ההתראות כדי לקבל שליטה רבה יותר על הערכת המדדים. המעקב תומך בסוגי השאילתות הבאים:

  • ‫PromQL היא שפת שאילתות פונקציונלית שמשמשת להערכת נתונים של סדרות זמן בזמן אמת. אפשר להגדיר מדיניות התראות כך שתכלול שאילתת PromQL בתנאי שלה. בשילובים של מדדים, ביחסים ובערכי סף של שינוי קנה מידה. הגדרת מדיניות התראות שמבוססת על PromQL ב- Google Cloudמאפשרת לצמצם את התלות בתשתית חיצונית של התראות. מידע נוסף זמין במאמרים בנושא PromQL ב-Cloud Monitoring וסקירה כללית על התראות PromQL.

  • מסנני Monitoring מאפשרים לכם להגדיר מדיניות התראות לשימוש ביחסי מדדים מבוססי-מסננים. אי אפשר להציג או לשנות מדיניות התראות שמבוססת על מסננים במסוף Google Cloud . דוגמה למדיניות שמשתמשת במסנני Monitoring מופיעה במאמר בנושא יחס מדדים.

ניהול מדיניות התראות ואירועים

אחרי שמפעילים מדיניות התראות, שירות Monitoring עוקב באופן רציף אחרי התנאים של המדיניות הזו. אי אפשר להגדיר את מדיניות ההתראות כך שתעקוב אחרי תנאים רק בתקופות זמן מסוימות. אם רוצים להשבית את מדיניות ההתראות לתקופה מסוימת, צריך ליצור השהיה.

אם אירוע פתוח ומערכת Monitoring קובעת שהתנאים של המדיניות שמבוססת על מדדים כבר לא מתקיימים, מערכת Monitoring סוגרת את האירוע באופן אוטומטי ושולחת הודעה על הסגירה.

תמחור

למידע על התמחור של Cloud Monitoring, אפשר לעיין בדף התמחור של Google Cloud Observability.

למידע על מעקב אחרי מספר טווחי המעקב או היומנים שנקלטים, או על קבלת התראה כשתוכן ספציפי נכלל ברשומה ביומן, אפשר לעיין במסמכים הבאים:

המאמרים הבאים