במאמר הזה מוסבר איך להשתמש במסוף Cloud Monitoring כדי לעקוב אחרי מופעי Spanner.
מסוף Cloud Monitoring מספק כמה כלים למעקב אחרי Spanner:
- לוח בקרה שנבחר בקפידה, שבו מוצגים תרשימים מוכנים מראש של משאבי Spanner
- תרשימים בהתאמה אישית, כולל תרשימים אד-הוק ב-Metrics Explorer וגם תרשימים בלוחות בקרה בהתאמה אישית
- התראות, שמודיעות לכם אם מדד מסוים חורג מסף שהגדרתם
אם אתם מעדיפים לעקוב אחרי Spanner באופן פרוגרמטי, אתם יכולים להשתמש בספריות הלקוח של Cloud Monitoring כדי לאחזר מדדים.
תצוגה מהירה של המדדים החשובים ביותר של המופע.שימוש בלוח הבקרה המאורגן של Cloud Monitoring
ב-Cloud Monitoring יש לוח בקרה מותאם אישית שבו מוצג סיכום של מידע חשוב על מופעי Spanner, כולל:
- אירועים: התראות מעקב שנוצרו על ידי משתמשים, שהן פתוחות, פעילות או שנפתרו
- אירועים: רשימה של יומני ביקורת של Spanner (אם האפשרות מופעלת וזמינה)
- Instances: סיכום ברמה גבוהה של מכונות Spanner, כולל קיבולת מחשוב, מספר מסדי הנתונים והתקינות של המכונה
- תרשימים מצטברים של קצב העברת הנתונים ושל השימוש בנפח האחסון
כדי להציג את מרכז הבקרה של Spanner:
במסוף Google Cloud , בוחרים באפשרות Monitoring או לוחצים על הלחצן הבא:
אם האפשרות Resources מוצגת בחלונית הניווט, בוחרים באפשרות Resources ואז באפשרות Cloud Spanner. אחרת, בוחרים באפשרות Dashboards ואז בוחרים בלוח הבקרה שנקרא Cloud Spanner.
הצגת פרטי המופע ומסד הנתונים
כשפותחים את לוח הבקרה המותאם אישית של Spanner, מוצגים נתונים מצטברים של כל המופעים. כדי לראות פרטים נוספים על מכונה ספציפית, לוחצים על שם המכונה בקטע Instances (מכונות).
לוח הבקרה מציג מידע כמו מטא-נתונים של מופעים, מסדי נתונים במופע ותרשימים של מדדים שונים שמחולקים לפי אזור.
בדף לוח הבקרה של המכונה, אפשר לראות גם תרשימים של מסד נתונים ספציפי במכונה:
בצד שמאל, מעל תרשימי המדדים של המופע, לוחצים על מדדי מסד נתונים.
בתפריט הנפתח Select a breakdown, בוחרים את מסד הנתונים שרוצים לבדוק.
בתרשימים במסוף Cloud Monitoring מוצגים נתונים על מסד הנתונים.
יצירת תרשימים מותאמים אישית למדדים של Spanner
אתם יכולים להשתמש ב-Cloud Monitoring כדי ליצור תרשימים מותאמים אישית למדדים של Spanner. אתם יכולים להשתמש ב-Metrics Explorer כדי ליצור תרשימים זמניים, אד-הוק, או שאתם יכולים ליצור תרשימים שמופיעים בלוחות בקרה בהתאמה אישית.
בפרט, Cloud Monitoring מאפשר ליצור תרשים מותאם אישית שמראה אם יש קורלציה בין שני מדדים או יותר. לדוגמה, אפשר לבדוק את המתאם בין ניצול המעבד לבין זמן האחזור במופע של Spanner. יכול להיות שהמתאם הזה מצביע על כך שהמופע זקוק לקיבולת מחשוב נוספת, או שחלק מהשאילתות גורמות לניצול גבוה של המעבד.
כדי להתחיל להשתמש בדוגמה הזו, פועלים לפי השלבים הבאים:
במסוף Google Cloud , בוחרים באפשרות Monitoring או לוחצים על הלחצן הבא:
אם Metrics Explorer מוצג בחלונית הניווט, בוחרים בו. אחרת, בוחרים באפשרות Resources (משאבים) ואז באפשרות Metrics Explorer.
לוחצים על הכרטיסייה אפשרויות תצוגה ואז מסמנים את התיבה סולם לוגריתמי בציר Y. האפשרות הזו עוזרת להשוות בין כמה מדדים כשערכי מדד אחד גדולים בהרבה מהערכים של המדדים האחרים.
בתפריט הנפתח שמעל החלונית השמאלית, בוחרים באפשרות קו.
לוחצים על הכרטיסייה Metrics. עכשיו אפשר להוסיף מדדים לתרשים.
כדי להוסיף לתרשים מדדי חביון, פועלים לפי השלבים הבאים:
- בתיבה Find resource type and metric, מזינים את הערך
spanner.googleapis.com/api/request_latenciesולוחצים על השורה שמופיעה מתחת לתיבה. - בתיבה Filter, מזינים את הערך
instance_id, ואז מזינים את מזהה המופע שרוצים לבדוק ולוחצים על Apply. - ברשימה הנפתחת Aggregator, לוחצים על max.
אופציונלי: משנים את אחוזון זמן האחזור:
- לוחצים על הצגת אפשרויות מתקדמות.
- לוחצים על התפריט הנפתח Aligner ואז על אחוזון ההשהיה שרוצים לראות.
ברוב המקרים, כדאי לבדוק את זמן האחזור של האחוזון ה-50 כדי להבין את זמן האחזור האופייני, או את זמן האחזור של האחוזון ה-99 כדי להבין את זמן האחזור של 1% הבקשות הכי איטיות.
כדי להוסיף לתרשים מדדים של ניצול המעבד:
- לוחצים על הוספת מדד.
- בתיבה Find resource type and metric, מזינים את הערך
spanner.googleapis.com/instance/cpu/utilizationולוחצים על השורה שמופיעה מתחת לתיבה. - בתיבה Filter, מזינים את הערך
instance_id, ואז מזינים את מזהה המופע שרוצים לבדוק ולוחצים על Apply. - ברשימה הנפתחת Aggregator, לוחצים על max.
עכשיו יש לכם תרשים שבו מוצגים מדדי השימוש במעבד והחביון של מופע Spanner. אם שני המדדים גבוהים מהצפוי בו-זמנית, אפשר לנקוט צעדים נוספים כדי לפתור את הבעיה.
מידע נוסף על יצירת תרשימים בהתאמה אישית זמין במסמכי Cloud Monitoring.
יצירת התראות למדדי Spanner
כשיוצרים אינסטנס של Spanner, בוחרים את קיבולת החישוב של האינסטנס. ככל שעומס העבודה של המופע משתנה, Spanner לא משנה באופן אוטומטי את קיבולת החישוב של המופע. לכן, צריך להגדיר כמה התראות כדי לוודא שהמופע יישאר במסגרת הערכים המקסימליים המומלצים לניצול המעבד והמגבלה המומלצת לאחסון.
בדוגמאות הבאות מוסבר איך להגדיר מדיניות התראות עבור חלק מהמדדים של Spanner. רשימה מלאה של המדדים הזמינים מופיעה במאמר רשימת המדדים של Spanner.
יחידת CPU בעדיפות גבוהה
כדי ליצור מדיניות התראות שמופעלת כשניצול המעבד בעדיפות גבוהה ב-Spanner גבוה מסף מומלץ, צריך להשתמש בהגדרות הבאות.
| תנאי חדש שדה |
ערך |
|---|---|
| משאב ומדד | בתפריט Resources בוחרים באפשרות Spanner Instance. בתפריט Metric categories בוחרים באפשרות Instance. בתפריט Metrics בוחרים באפשרות CPU Utilization by priority. (The metric.type is spanner.googleapis.com/instance/cpu/utilization_by_priority).
|
| מסנן | instance_id = YOUR_INSTANCE_IDpriority = high
|
| בסדרות עיתיות קיבוץ סדרות עיתיות לפי |
location למופעים במספר אזורים, משאירים את השדה ריק למופעים אזוריים. |
| בסדרות של נתונים על ציר הזמן צבירה של נתונים על ציר הזמן |
sum |
| חלון מתגלגל | 10 m |
| פונקציה אנליטית (חלון נע) | mean |
| הגדרת טריגר להתראה שדה |
ערך |
|---|---|
| סוג התנאי | Threshold |
| טריגר להתראה | Any time series violates |
| מיקום הסף | Above threshold |
| ערך הסף | 45% למופעים במספר אזורים, 65% למופעים אזוריים.
|
| חלון הבדיקה מחדש | 10 minutes |
ממוצע נע של השימוש במעבד (CPU) ב-24 שעות
כדי ליצור מדיניות התראות שמופעלת כשהממוצע הנע של ניצול המעבד ב-Spanner למשך 24 שעות גבוה מסף מומלץ, משתמשים בהגדרות הבאות.
| תנאי חדש שדה |
ערך |
|---|---|
| משאב ומדד | בתפריט Resources בוחרים באפשרות Spanner Instance. בתפריט Metric categories בוחרים באפשרות Instance. בתפריט Metrics, בוחרים באפשרות Smoothed CPU utilization. (The metric.type is spanner.googleapis.com/instance/cpu/smoothed_utilization).
|
| מסנן | instance_id = YOUR_INSTANCE_ID |
| בסדרות של נתונים על ציר הזמן צבירה של נתונים על ציר הזמן |
sum |
| חלון מתגלגל | 10 m |
| פונקציה אנליטית (חלון נע) | mean |
| הגדרת טריגר להתראה שדה |
ערך |
|---|---|
| סוג התנאי | Threshold |
| טריגר להתראה | Any time series violates |
| מיקום הסף | Above threshold |
| סף | 90%
|
| חלון הבדיקה מחדש | 10 minutes |
אחסון
כדי ליצור מדיניות התראות שתופעל כשהנפח של אחסון נתוני מופע Spanner יהיה מעל סף מומלץ, צריך להשתמש בהגדרות הבאות.
| תנאי חדש שדה |
ערך |
|---|---|
| משאב ומדד | בתפריט Resources בוחרים באפשרות Spanner Instance. בתפריט Metric categories בוחרים באפשרות Instance. בתפריט Metrics בוחרים באפשרות Storage used. (The metric.type is spanner.googleapis.com/instance/storage/utilization).
|
| מסנן | instance_id = YOUR_INSTANCE_ID |
| בסדרות של נתונים על ציר הזמן צבירה של נתונים על ציר הזמן |
sum |
| חלון מתגלגל | 10 m |
| פונקציה אנליטית (חלון נע) | max |
| הגדרת טריגר להתראה שדה |
ערך |
|---|---|
| סוג התנאי | Threshold |
| תנאי ההפעלה אם | Any time series violates |
| מיקום הסף | Above threshold |
| ערך הסף | לא צריך להגדיר סף ספציפי לנפח האחסון המקסימלי לכל צומת. עם זאת, מומלץ להגדיר התראה שתתקבל כשמתקרבים למכסת האחסון המקסימלית. מידע נוסף זמין במאמר מדדים של ניצול נפח האחסון. |
| חלון הבדיקה מחדש | 10 minutes |
המאמרים הבאים
- הסבר על המדדים CPU utilization ו-latency ב-Spanner.
- אפשר להשתמש במסוף Google Cloud כדי לקבל תצוגה מהירה של המדדים החשובים ביותר למופע שלכם.
- מידע נוסף על Cloud Monitoring