ניהול אירועים עבור מדיניות התראות מבוססת-SQL

אירוע הוא רשומה של מקרים שבהם התנאי של מדיניות ההתראות מתקיים. בדרך כלל, Cloud Monitoring פותח אירוע ושולח התראה כשמתקיים התנאי של מדיניות ההתראות. עם זאת, לא נוצרים אירועים בנסיבות הבאות:

לכל אירוע, כלי המעקב יוצר דף פרטי אירוע שמאפשר לכם לנהל את האירוע, וכולל מידע על האירוע שיכול לעזור לכם לפתור את הבעיה. לדוגמה, בדף פרטי האירוע מוצגות רשימות של סיכומי תוצאות של שאילתות SQL ואירועים קשורים.

במאמר הזה מוסבר איך אפשר למצוא את האירועים. במאמר מוסבר גם איך אפשר להשתמש בדף פרטי האירוע כדי לנהל אירועים במדיניות התראות מבוססת-SQL, שבודקת את התוצאות של שאילתת SQL שמופעלת על נתונים מקבוצות של רשומות ביומן.

התכונה הזו נתמכת רק בפרויקטים של Google Cloud . בהגדרות של מרכז האפליקציות, בוחרים את פרויקט המארח או את פרויקט הניהול של מרכז האפליקציות.

לפני שמתחילים

כדי לקבל את ההרשאות שדרושות לצפייה באירועים ולניהול שלהם, אתם צריכים לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים בפרויקט:

להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

יכול להיות שאפשר לקבל את ההרשאות הנדרשות גם באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש.

מידע נוסף על תפקידים ב-Cloud Monitoring זמין במאמר בקרת גישה באמצעות ניהול זהויות וגישה.

צפייה באירועים

כדי לראות אירועים בפרויקט, משתמשים במסוף Google Cloud , ב-CLI של gcloud (גרסת Preview ציבורית) או ב-Monitoring API (גרסת Preview ציבורית).

מסוף Google Cloud

כדי להציג את רשימת האירועים ב Google Cloud פרויקט:

  1. נכנסים לדף  Alerting במסוף Google Cloud :

    כניסה אל התראות

    אם משתמשים בסרגל החיפוש כדי למצוא את הדף הזה, בוחרים בתוצאה שבה הכותרת המשנית היא Monitoring.

  2. בסרגל הכלים של מסוף Google Cloud , בוחרים את Google Cloud הפרויקט. בהגדרות של מרכז האפליקציות, בוחרים את פרויקט המארח או את פרויקט הניהול של מרכז האפליקציות.

    בדף Alerting מוצג מידע על מדיניות ההתראות, על השהיות ועל האירועים:

    • בחלונית סיכום מופיע מספר האירועים הפתוחים.
    • בטבלה אירועים מוצגים האירועים הפתוחים האחרונים. כדי להציג בטבלה את האירועים האחרונים, כולל אירועים שנסגרו, לוחצים על הצגת אירועים שנסגרו.
  3. כדי להציג את הפרטים של אירוע ספציפי, בוחרים את האירוע ברשימה.

    ייפתח הדף פרטי האירוע. מידע נוסף על הדף פרטי האירוע מופיע בקטע חקירת אירוע במסמך הזה.

חיפוש אירועים ישנים יותר

בטבלה Incidents בדף Alerting מוצגים האירועים הפתוחים האחרונים. כדי לראות אירועים ישנים יותר, מבצעים אחת מהפעולות הבאות:

  • כדי לעבור בין הדפים בטבלה אירועים, לוחצים על  חדשים יותר או על  ישנים יותר.

  • כדי לפתוח דף שבו אפשר לראות את כל האירועים ולסנן אותם, לוחצים על הצגת כל האירועים. הדף אירועים ייפתח. בדף הזה, מבצעים את הפעולות הבאות:

    • הצגת כל האירועים, כולל אירועים שנסגרו. כדי להציג את כל האירועים, לוחצים על הצגת אירועים סגורים.
    • סינון תקריות. מידע על הוספת מסננים זמין במאמר בנושא סינון אירועים.
    • אישור או סגירה של אירוע, או השהיה של מדיניות ההתראות שלו. כדי לגשת לאפשרויות האלה, לוחצים על  אפשרויות נוספות בשורה של האירוע ובוחרים אפשרות מהתפריט. מידע נוסף מופיע במאמר ניהול אירועים.

סינון תקריות

כדי להגביל את האירועים שמוצגים בטבלה, מוסיפים מסננים. אם מוסיפים כמה מסננים, בטבלה מוצגים רק אירועים שעומדים בכל המסננים.

כדי לסנן את טבלת האירועים:

  1. בדף אירועים, לוחצים על  סינון הטבלה ואז בוחרים מאפיין של מסנן. מאפייני המסנן כוללים את האפשרויות הבאות:

    • מצב האירוע
    • שם מדיניות ההתראות
    • מתי האירוע נפתח או נסגר
  2. בוחרים ערך מהתפריט המשני או מזינים ערך בסרגל הסינון.

    המסנן יופיע בטבלה אירועים.

gcloud

אפשר להשתמש ב-gcloud כדי לקבל מידע על תקריות ולראות רשימה של תקריות.

קבלת אירוע

לפני השימוש בנתוני הפקודה הבאים, צריך להחליף את הנתונים הבאים:

  • ALERT_NAME: שם המשאב של ההתראה. לדוגמה, projects/my-project/alerts/my-alert-id.

מריצים את הפקודה gcloud alpha monitoring alerts describe:

‫Linux,‏ macOS או Cloud Shell

gcloud alpha monitoring alerts describe ALERT_NAME

‏Windows (PowerShell)

gcloud alpha monitoring alerts describe ALERT_NAME

Windows‏ (cmd.exe)

gcloud alpha monitoring alerts describe ALERT_NAME
הפקודה מחזירה תגובה עם פרטי ההתראה, כמו מצב ההתראה, התוויות שצורפו ומדיניות ההתראות של המקור. הערה: התוויות בתגובה עשויות להשתנות בזמן שהתכונה הזו נמצאת בגרסת טרום-השקה. התגובה אמורה להיות דומה לדוגמה הבאה:
{
  "name": "projects/my-project/alerts/my-alert-id",
  "state": "OPEN",
  "open_time": "2025-06-11T09:53:46Z",
  "resource": {
    "type": "sql_alert"
  },
  "policy": {
    "name": "projects/my-project/alertPolicies/POLICY_1",
    "displayName": "test-policy"
  },
  "summaryText": "The row count SQL Condition for \"test-policy\" is above the threshold of 1."
}

הצגת רשימת אירועים

אפשר לרשום אירועים בפרויקט ולסנן את התוצאות באמצעות ה-CLI של gcloud.

לפני השימוש בנתוני הפקודה הבאים, צריך להחליף את הנתונים הבאים:

  • PROJECT_ID: מזהה הפרויקט.

מריצים את הפקודה gcloud alpha monitoring alerts list:

‫Linux,‏ macOS או Cloud Shell

gcloud alpha monitoring alerts list

‏Windows (PowerShell)

gcloud alpha monitoring alerts list

Windows‏ (cmd.exe)

gcloud alpha monitoring alerts list
הפקודה מחזירה תגובה עם פרטי ההתראה, כמו מצב ההתראה, התוויות שצורפו ומדיניות ההתראות של המקור. הערה: התוויות בתגובה עשויות להשתנות בזמן שהתכונה הזו נמצאת בגרסת טרום-השקה. התגובה אמורה להיות דומה לדוגמה הבאה:
{
  "alerts": [
    {
      "name": "projects/my-project/alerts/my-alert-id",
      "state": "OPEN",
      "open_time": "2025-06-11T09:53:46Z",
      "resource": {
        "type": "sql_alert"
      },
      "policy": {
        "name": "projects/my-project/alertPolicies/POLICY_1",
        "displayName": "test-policy"
      },
      "summaryText": "The row count SQL Condition for \"test-policy\" is above the threshold of 1."
    }
  ]
}
אפשר גם להשתמש בדגלים האופציונליים הבאים כדי לסנן, למיין או לשנות את הפלט:
  • --filter: הזנת ביטוי סינון כדי לסנן התראות לפי זמן או לפי תווית. לדוגמה, כדי לסנן לפי זמן משתמשים ב---filter='close_time>="2025-09-10T00:00:00Z"', וכדי לסנן לפי תווית משתמשים ב---filter='resource.labels.key="value"'.

  • --sort-by: רשימה מופרדת בפסיקים של שדות שלפיהם הפלט ימוין. לדוגמה, --sort-by=open_time.

  • --uri: הפקודה מחזירה רשימה של מזהי URI של משאבים במקום פלט ברירת המחדל.

  • --limit: מגדירים את הדגל הזה לערך 2 או לערך גבוה יותר כדי להגביל את מספר ההתראות שמוחזרות. אל תשתמשו בדגל הזה בשילוב עם הדגל --filter.

Monitoring API

אפשר להשתמש ב-Monitoring API כדי לקבל אירועים ולרשום אירועים.

קבלת אירוע

כדי לקבל פרטים על אירוע יחיד באמצעות Monitoring API, משתמשים בשיטה alerts.get.

לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:

  • PROJECT_ID: מזהה הפרויקט.
  • ALERT_ID: מזהה ההתראה.

ה-method של ה-HTTP וכתובת ה-URL:

GET https://monitoring.googleapis.com/v3/projects/PROJECT_ID/alerts/ALERT_ID

כדי לשלוח את הבקשה צריך להרחיב אחת מהאפשרויות הבאות:

הפקודה מחזירה תשובה עם פרטי ההתראה, כמו מצב ההתראה, התוויות שצורפו ומדיניות ההתראות של המקור. הערה: התוויות בתגובה עשויות להשתנות בזמן שהתכונה הזו נמצאת בגרסת טרום-השקה. התגובה אמורה להיות דומה לדוגמה הבאה:
{
  "name": "projects/my-project/alerts/my-alert-id",
  "state": "OPEN",
  "open_time": "2025-06-11T09:53:46Z",
  "resource": {
    "type": "sql_alert"
  },
  "policy": {
    "name": "projects/my-project/alertPolicies/POLICY_1",
    "displayName": "test-policy"
  },
  "summaryText": "The row count SQL Condition for \"test-policy\" is above the threshold of 1."
}

הצגת רשימת תקריות

כדי להציג רשימה של אירועים בפרויקט ולסנן את התוצאות באמצעות Monitoring API, משתמשים בשיטה alerts.list.

לפני שמשתמשים בנתוני הבקשה, צריך להחליף את הנתונים הבאים:

  • PROJECT_ID: מזהה הפרויקט.

ה-method של ה-HTTP וכתובת ה-URL:

GET https://monitoring.googleapis.com/v3/projects/PROJECT_ID/alerts

כדי לשלוח את הבקשה צריך להרחיב אחת מהאפשרויות הבאות:

הפקודה מחזירה תשובה עם פרטי ההתראה, כמו מצב ההתראה, התוויות שצורפו ומדיניות ההתראות של המקור. הערה: התוויות בתגובה עשויות להשתנות בזמן שהתכונה הזו נמצאת בגרסת טרום-השקה. התגובה אמורה להיות דומה לדוגמה הבאה:
{
  "alerts": [
    {
      "name": "projects/my-project/alerts/my-alert-id",
      "state": "OPEN",
      "open_time": "2025-06-11T09:53:46Z",
      "resource": {
        "type": "sql_alert"
      },
      "policy": {
        "name": "projects/my-project/alertPolicies/POLICY_1",
        "displayName": "test-policy"
      },
      "summaryText": "The row count SQL Condition for \"test-policy\" is above the threshold of 1."
    }
  ]
}
משתמשי Curl יכולים להוסיף את הדגל --data-urlencode ואחריו ביטוי מסנן כדי לסנן התראות לפי זמן או תווית. דוגמאות:

כדי להציג רשימה של התראות שנפתחו בשעה האחרונה:

--data-urlencode "filter=(open_time>=\"`date -u -d "1 hour ago" +"%Y-%m-%dT%H:%M:%SZ"`\")"

הצגה וסינון של התראות פתוחות מהיום האחרון:

--data-urlencode "filter=(open_time>=\"`date -u -d "1 DAY ago" +"%Y-%m-%dT%H:%M:%SZ"`\" AND state=open)"

הצגה וסינון של התראות שנפתחו בין שני פרקי זמן:

--data-urlencode "filter=(open_time>=\"`date -u -d "2 DAY ago" +"%Y-%m-%dT%H:%M:%SZ"`\" AND open_time<=\"`date -u -d "1 DAY ago" +"%Y-%m-%dT%H:%M:%SZ"`\")"

הצגה וסינון של התראות לפי תווית משתמש. בדוגמה הזו, מסננים לפי תווית משתמש עם השם app והערך my-gke-app:

--data-urlencode "filter=(policy.user_labels.app=\"my-gke-app\")"
משתמשי PowerShell יכולים להשתמש בדוגמה הבאה כדי להוסיף מסנן מבוסס-זמן לכתובת ה-URL של הבקשה:
$baseUrl = "https://monitoring.googleapis.com/v3/projects/my-project/alerts"
$filterValue = (Get-Date).AddHours(-1).ToString("yyyy-MM-ddTHH:mm:ssZ")
$filter = 'open_time >= "' + $filterValue + '"'
$encodedFilter = [System.Uri]::EscapeDataString($filter)
$url = $baseUrl + "?filter=" + $encodedFilter

חקירת אירוע

בדף פרטי האירוע מופיע מידע שיכול לעזור לכם לזהות את הסיבה לאירוע.

בדיקת תוצאות של שאילתות

בחלונית Total slot time consumed per day (הזמן הכולל של משבצות זמן שהוקצו ליום) מוצג משך הזמן שמשבצות הזמן השמורות ב-BigQuery הקדישו להרצת שאילתות SQL עבור מדיניות ההתראות ב-24 השעות האחרונות.

בחלונית SQL query results מוצגת רשימה של סיכומי תוצאות השאילתה מכל פעם ש-Observability Analytics הפעיל את שאילתת ה-SQL מהתנאי של מדיניות ההתראות. כברירת מחדל, הרשימה מסוננת כך שיוצגו רק שאילתות שתאמו לתנאי של מדיניות ההתראות.

  • כדי לראות את השאילתה ואת טבלת התוצאות של השאילתה מזמן ספציפי שבו Observability Analytics הרכיב את השאילתה, לוחצים על ערך מהעמודה Query run time (זמן הרצת השאילתה).
  • כדי לעבור בין הצגת תוצאות של שאילתות שתואמות לתנאי מדיניות ההתראות לבין הצגת כל השאילתות שהופעלו על ידי Observability Analytics ממדיניות ההתראות, לוחצים על הצגת שאילתות שתואמות לתנאי ההתראה בלבד.

הצגת מידע נוסף

בקטע Documentation מוצגת תבנית התיעוד של ההתראות שסיפקתם כשיצרתם את מדיניות ההתראות. המידע הזה יכול לכלול תיאור של מה שמדיניות ההתראות עוקבת אחריו, וגם טיפים לצמצום הסיכון. מידע נוסף זמין במאמר בנושא הוספת הערות להתראות באמצעות תיעוד שהוגדר על ידי המשתמש.

אם לא הגדרתם תיעוד למדיניות ההתראות, בחלונית תיעוד תוצג ההודעה 'לא הוגדר תיעוד'.

כדי לעזור לכם לגלות בעיות בסיסיות באפליקציה, אתם יכולים לבדוק אירועים שקשורים לתנאים אחרים של מדיניות ההתראות.

בקטע אירועים קשורים מוצגת רשימה של אירועים אחרים שנוצרו כשנמצאה התאמה לתנאי של מדיניות ההתראות.

ניהול אירועים

אירועים יכולים להיות באחד מהמצבים הבאים:

  •  פתוח: התנאי של מדיניות ההתראות מבוססת ה-SQL התקיים, והאירוע עדיין פתוח. אם אותו תנאי מתקיים שוב וכבר יש אירוע פתוח, לא ייפתח אירוע חדש.

  •  התקבלה תגובה: האירוע פתוח וסומן ידנית כאירוע שהתקבלה לגביו תגובה. בדרך כלל, הסטטוס הזה מציין שהתקרית נמצאת בחקירה.

  •  נסגר: סגרת את האירוע באופן ידני, או שהוא נסגר באופן אוטומטי אחרי שתקופת הסגירה האוטומטית הסתיימה.

אישור תקריות

מומלץ לסמן תקרית כמאושרת כשמתחילים לחקור את הסיבה לתקרית.

כדי לסמן אירוע כמאושר:

  1. בטבלה אירועים בדף התראות, לוחצים על הצגת כל האירועים.
  2. בדף אירועים, מוצאים את האירוע שרוצים לאשר, ואז מבצעים אחת מהפעולות הבאות:

    • לוחצים על אפשרויות נוספות  ואז על אישור.
    • פותחים את דף הפרטים של האירוע ולוחצים על אישור קבלת האירוע.

העברת מדיניות התראות למצב נודניק

כדי למנוע מ-Monitoring ליצור אירועים ולשלוח התראות במהלך תקופת זמן מסוימת, משביתים את מדיניות ההתראות הרלוונטית. כשמשתיקים מדיניות התראות, האירועים שקשורים למדיניות ההתראות נשארים פתוחים אבל לא גורמים לשליחת התראות נוספות. האירועים נסגרים על סמך משך הסגירה האוטומטית של מדיניות ההתראות.

כדי להשהות אירוע שמוצג:

  1. בדף פרטי האירוע, לוחצים על השהיית מדיניות.

  2. בוחרים את משך הנדנוד. אחרי שבוחרים את משך הדחייה, הדחייה מתחילה מיד.

אפשר גם להשהות מדיניות התראות מהדף אירועים. כדי לעשות זאת, מוצאים את האירוע שרוצים להשהות, לוחצים על  אפשרויות נוספות ואז בוחרים באפשרות השהיה. אתם יכולים להשהות את מדיניות ההתראות במהלך הפסקות שירות כדי למנוע התראות נוספות במהלך תהליך פתרון הבעיות.

סגירת אירועים

אתם יכולים לאפשר ל-Monitoring לסגור את האירוע בשבילכם, או לסגור אותו בעצמכם.

הכלי 'מעקב' סוגר באופן אוטומטי אירוע כשמשך הזמן לסגירה אוטומטית של מדיניות ההתראות מסתיים. כברירת מחדל, משך הזמן עד לסגירה אוטומטית הוא 7 ימים. משך הזמן המינימלי לסגירה אוטומטית הוא 30 דקות.

משך הזמן לסגירה אוטומטית מציין את הזמן שצריך לעבור, בלי שהגורם לאירוע יחזור על עצמו, לפני שהאירוע ייסגר. לכן, אם תקרית פתוחה והגורם לה מתרחש שוב, היא יכולה להישאר פתוחה למשך זמן ארוך יותר מהזמן שמוגדר לסגירה אוטומטית.

כדי לסגור אירוע:

  1. בטבלה אירועים בדף התראות, לוחצים על הצגת כל האירועים.
  2. בדף אירועים, מחפשים את האירוע שרוצים לסגור ומבצעים אחת מהפעולות הבאות:

    • לוחצים על  הצגת פרטים נוספים ואז בוחרים באפשרות סגירת האירוע.
    • פותחים את הדף פרטי האירוע של האירוע הרלוונטי ואז לוחצים על סגירת האירוע.

אם מופיעה ההודעה Unable to close incident, כדאי לנסות שוב בעוד כמה דקות. אי אפשר לסגור אירוע חדש באופן מיידי כי התנאים שגרמו לאירוע עדיין נחשבים פעילים על ידי מערכת ההתראות.

שמירת נתונים ומגבלות

מידע על מגבלות ועל תקופת השמירה של אירועים זמין במאמר מגבלות על התראות.

המאמרים הבאים