הצגה ובדיקה של אנומליות

הדף הזה רלוונטי ל-Apigee ול-Apigee Hybrid.

לעיון במסמכי התיעוד של Apigee Edge

בדף הזה מוסבר איך להשתמש בלוח הבקרה של חריגות בפעולות כדי לראות חריגות שזוהו ולחקור אותן. אתם יכולים לחקור את החריגה ולנקוט פעולה מתאימה אם יש צורך בכך. אתם יכולים גם ליצור התראה על חריגה כדי לקבל הודעה אם אירועים דומים יתרחשו בעתיד.

אנומליה שזוהתה כוללת את הפרטים הבאים:

  • מדד שגרם לאנומליה, כמו זמן האחזור של שרת ה-Proxy או קוד שגיאת HTTP.
  • רמת החומרה של החריגה. רמת החומרה יכולה להיות קלה, בינונית או חמורה, בהתאם לרמת המהימנות של המודל. רמת סמך נמוכה מצביעה על חומרה קלה, ואילו רמת סמך גבוהה מצביעה על חומרה גבוהה.

צפייה בחריגות

מרכז הבקרה של חריגות בפעולות בממשק המשתמש של Apigee הוא המקור העיקרי למידע על חריגות בפעולות שזוהו. בלוח הבקרה מוצגת רשימה של חריגות מהזמן האחרון.

כדי לפתוח את לוח הבקרה 'אנומליות בפעולות':

  1. במסוף Google Cloud , נכנסים לדף Analytics > Operations anomalies.

    מעבר אל 'אנומליות בפעולות'

  2. עוברים לארגון שרוצים לעקוב אחריו.

יוצג לוח הבקרה של אנומליות בפעולות.

צפייה באנומליות בלוח הבקרה של אנומליות בפעולות

כברירת מחדל, במרכז הבקרה מוצגות אנומליות שהתרחשו במהלך השעה האחרונה. אם לא זוהו אנומליות במהלך פרק הזמן הזה, לא מוצגות שורות במרכז הבקרה. אפשר לבחור טווח זמן ארוך יותר בתפריט טווח הזמן בפינה השמאלית העליונה של מרכז הבקרה.

כל שורה בטבלה תואמת לאנומליה שזוהתה, ומוצגים בה הפרטים הבאים:

  • התאריך והשעה של האנומליה.
  • סיכום קצר של האנומליה, כולל ה-proxy שבו היא התרחשה.
  • הסביבה שבה התרחשה החריגה.
  • האזור שבו התרחשה החריגה.
  • רמת החומרה של אירוע האנומליה: קלה, בינונית או חמורה. רמת החומרה מבוססת על מדד סטטיסטי (p-value) של הסבירות שהאירוע יתרחש באופן אקראי (ככל שהאירוע פחות סביר, כך רמת החומרה שלו גבוהה יותר).

בדיקת חריגות

כשרואים אנומליה בלוח הבקרה של אנומליות בפעולות, אפשר לבדוק אותה לעומק בלוחות הבקרה של API Monitoring. כדי לפתוח את לוח הבקרה של API Monitoring Investigate, לוחצים על Investigate (בדיקה) בעמודה Summary (סיכום) של האנומליה.

במרכזי הבקרה מוצגים תרשימים וטבלאות של נתוני API עדכניים, שמספקים מידע ספציפי מאוד על מה שהתרחש ב-API בזמן האנומליה.

דוגמה: בדיקת אנומליה בקוד תקלה

נניח שאתם מעיינים בלוח הבקרה של חריגות בפעולות ורואים את החריגה שמוצגת למטה:

צפייה באנומליות בלוח הבקרה של אנומליות בפעולות

אחרי שלוחצים על Investigate בעמודה Summary, מוצגת למטה לוח הבקרה API Monitoring Investigate.

חריגה שמוצגת במרכז הבקרה 'חקירה'.

בחלונית Anomaly Event Details (פרטי אירוע חריגה) מוצג ציר זמן של שיעור השגיאות. מהתרשים אפשר לראות שהחריגה התרחשה אחרי 7:00 בבוקר, כששיעור השגיאות קפץ מ-0.4 ל-0.8.

שיעור השגיאות בתרשים ציר הזמן כולל שגיאות של כל קודי התקלה. כדי לראות פירוט של השגיאות לפי קודי תקלות שונים, מעיינים בתרשים Fault Code by Time (קוד תקלה לפי זמן) שמוצג מתחת לציר הזמן.

הערה: אם התרשים 'קוד תקלה לפי זמן' לא מוצג כרגע, בוחרים באפשרות קוד תקלה בתפריט תרשימים כדי להציג אותו: בוחרים בתרשים Fault Code (קוד תקלה).

העמודה המוקפת בעיגול בתרשים Fault Code by Time (קוד השגיאה לפי זמן) תואמת למרווח הזמן שמכיל את זמן האנומליה.

הערה: הבדל קטן בין הנתונים שמוצגים בתרשים לבין השעה שבה דווחה האנומליה הוא דבר נורמלי.

מעיינים בגרף Fault Code by Time (קוד תקלה לפי זמן).

במרווח הזמן 07:03 - 07:27, היו 1,499 תגובות עם קוד תקלה steps.json2xml.SourceUnavailable (קוד שגיאה שמוחזר כשמקור הודעת המדיניות של JSON ל-XML לא זמין). זהו קוד השגיאה שהפעיל את האנומליה. לעומת זאת, במהלך ארבעת המרווחים הקודמים, המספר הממוצע של תגובות עם קוד השגיאה הזה היה בערך 291, כך שהעלייה ל-1,499 הייתה בהחלט אירוע חריג.

מידע נוסף על הודעת השגיאה SourceUnavailable זמין במאמר בנושא פתרון בעיות של שגיאות בזמן ריצה במדיניות JSON ל-XML.

בשלב הזה, יש כמה דרכים להמשיך לחקור את הסיבה לאנומליה:

  • כדי להציג נתונים מפורטים של קודי התקלה בזמן החריגה, לוחצים על התא של החריגה בתרשים Fault Code by Time (קוד תקלה לפי זמן).

    לוחצים על התא של האנומליה בטבלה.

    בחלונית השמאלית מוצגות טבלאות של התפלגות steps.json2xml.SourceUnavailable לפי מקור התקלה, שרת proxy וקוד סטטוס.

    בדוגמה הזו, הטבלאות לא מספקות מידע נוסף כי כל קודי התקלה נובעים מאותו מקור תקלה, פרוקסי וקוד סטטוס. אבל במצבים אחרים, טבלאות ההפצה יכולות להצביע על המיקום ועל הגורם לאנומליה.

  • יוצרים התראה לגבי האנומליה ומגדירים התראה. אחרי שתעשו את זה, תקבלו הודעה על חריגות בפעולות בכל פעם שאירוע דומה יתרחש בעתיד.