מעקב אחרי מופעים באמצעות תובנות מערכת

במאמר הזה מוסבר איך להשתמש בלוח הבקרה של תובנות המערכת כדי לעקוב אחרי מופעים ומסדי נתונים של Spanner.

סקירה כללית של תובנות המערכת

במרכז השליטה של תובנות המערכת מוצגים כרטיסי מידע ותרשימים לגבי מופע או מסד נתונים שנבחרו, ומוצגים מדדים של זמן אחזור, ניצול CPU, אחסון, קצב העברת נתונים ונתונים סטטיסטיים אחרים של ביצועים. אפשר לראות תרשימים של טווחי זמן לבחירה, החל משעה אחת ועד 30 ימים.

לוח הבקרה של תובנות המערכת כולל את הקטעים הבאים, עם מספרים שתואמים לצילום המסך הבא של ממשק המשתמש:

  1. אמצעי בחירת תובנות: בוחרים את מסדי הנתונים, מחיצות המופעים והאזורים שמהם יאוכלס לוח הבקרה. בתובנות לגבי המערכת מוצגים מחיצות של מופעים ובחירות של אזורים, אם יש במופע כמה מחיצות או אזורים.
  2. מסנן טווח הזמן: סינון הנתונים הסטטיסטיים לפי טווח זמן, כמו שעות, ימים או טווח מותאם אישית.
  3. בורר מרכזי הבקרה: אפשר לבחור תצוגות בהתאמה אישית או לאפס את התובנות של המערכת לתצוגת ברירת המחדל המוגדרת מראש.
  4. הערות: בוחרים את סוגי האירועים של התראות על תובנות כדי להוסיף הערות לתרשימים.
  5. התאמה אישית של מרכזי בקרה: אפשר להתאים אישית את המראה, המיקום והתוכן של הווידג'טים במרכז הבקרה ושל מרכז הבקרה של תובנות המערכת. במסמך הזה מתואר מרכז הבקרה המוגדר מראש.
  6. כרטיסי מידע: מציגים נתונים סטטיסטיים בנקודת זמן מסוימת, במהלך התקופה שנבחרה.
  7. תרשימים: תרשימים של ניצול המעבד, קצב העברת הנתונים, זמן האחזור, השימוש באחסון ועוד. התראות על תובנות שהוגדרו באמצעות הערות מופיעות בתרשימים עם סמלי פעמון.

מרכז בקרה עם תובנות לגבי המערכת, שבו רכיבים ממוספרים שמתוארים ברשימה הקודמת

התפקידים הנדרשים

כדי לקבל את ההרשאות שדרושות לצפייה בלוחות בקרה של תובנות או לשינוי שלהם, כולל לוחות בקרה בהתאמה אישית, צריך לבקש מהאדמין להקצות לכם את תפקידי ה-IAM הבאים בפרויקט:

להסבר על מתן תפקידים, ראו איך מנהלים את הגישה ברמת הפרויקט, התיקייה והארגון.

התפקידים המוגדרים מראש האלה כוללים את ההרשאות שנדרשות כדי להציג או לשנות לוחות בקרה של תובנות, כולל לוחות בקרה בהתאמה אישית. כדי לראות בדיוק אילו הרשאות נדרשות, אפשר להרחיב את הקטע ההרשאות הנדרשות:

ההרשאות הנדרשות

כדי להציג או לשנות מרכזי תובנות, כולל מרכזי תובנות בהתאמה אישית, נדרשות ההרשאות הבאות:

  • כדי ליצור מרכזי בקרה בהתאמה אישית: monitoring.dashboards.create
  • כדי לערוך מרכזי בקרה בהתאמה אישית: monitoring.dashboards.update
  • כדי להציג מרכזי בקרה בהתאמה אישית: monitoring.dashboards.get, monitoring.dashboards.list

יכול להיות שתקבלו את ההרשאות האלה באמצעות תפקידים בהתאמה אישית או תפקידים מוגדרים מראש אחרים.

התאמה אישית של מרכז הבקרה של תובנות המערכת

לוח הבקרה 'תובנות לגבי המערכת' הוא לוח בקרה מוגדר מראש שאפשר להתאים אישית כדי להציג את המידע שהכי חשוב לכם. אפשר להוסיף תרשימים חדשים, לשנות את הפריסה ולסנן את הנתונים כדי להתמקד במשאבים ספציפיים.

השינויים בלוח הבקרה של תובנות המערכת לא הרסניים, ואפשר לאפס אותם על ידי הגדרת בורר לוח הבקרה למוגדר מראש.

שינוי לוח הבקרה

כדי לשנות את מרכז הבקרה, לוחצים על התאמה אישית של מרכזי הבקרה. אלה האפשרויות שעומדות לרשותכם:

  • כדי להוסיף ווידג'ט: בסרגל הכלים של לוח הבקרה, לוחצים על הוספת ווידג'ט, בוחרים את הווידג'ט שרוצים להוסיף ומגדירים אותו.
  • כדי לערוך ווידג'ט: מעבירים את העכבר מעל הווידג'ט כדי להציג את סרגל הכלים שלו, ואז לוחצים על עריכה. אתם יכולים לשנות את סוג הווידג'ט ולהתאים אישית את הנתונים שמוצגים בו.
  • שיבוט של ווידג'ט: מעבירים את העכבר מעל ווידג'ט כדי להציג את סרגל הכלים שלו, לוחצים על אפשרויות נוספות של התרשים ואז על שיבוט הווידג'ט.
  • כדי למחוק ווידג'ט: מעבירים את העכבר מעל הווידג'ט כדי להציג את סרגל הכלים שלו, לוחצים על אפשרויות נוספות של התרשים ואז על מחיקת הווידג'ט.
  • שינוי הפריסה: אפשר לגרור את הווידג'טים כדי לשנות את המיקום שלהם, ולגרור את הפינות שלהם כדי לשנות את הגודל שלהם.
  • נותנים שם לתצוגה המותאמת אישית: אפשר להגדיר את השם של התצוגה המותאמת אישית בתיבה שם התצוגה המותאמת אישית.
  • שמירת לוח הבקרה: כדי לשמור את התצוגה בהתאמה אישית, לוחצים על שמירה. אפשר גם לצאת בלי לשמור את השינויים על ידי לחיצה על יציאה ממצב עריכה.

כרטיסי מידע, תרשימים ומדדים של תובנות לגבי המערכת

בלוח הבקרה של תובנות המערכת מוצגים התרשימים והמדדים הבאים, כדי להציג את הסטטוס הנוכחי וההיסטורי של מופע. רוב התרשימים והמדדים זמינים ברמת המופע. אפשר גם לראות הרבה תרשימים ומדדים של מסד נתונים יחיד בתוך מופע.

כרטיסי מידע זמינים

שם תיאור
ניצול יחידת העיבוד המרכזית (CPU) סה"כ השימוש ב-CPU במופע או במסד נתונים נבחר. במקרה של מכונה בשני אזורים או במספר אזורים, המדד הזה מייצג את ממוצע השימוש במעבד בכל האזורים.
זמן אחזור (p99) חביון P99 (האחוזון ה-99) לפעולות קריאה וכתיבה במופע או במסד נתונים נבחר, שמייצג את הזמן שבו 99% מהפעולות האלה מסתיימות.
זמן אחזור (p50) חביון P50 (האחוזון ה-50) לפעולות קריאה וכתיבה במופע או במסד נתונים נבחר, שמייצג את הזמן שבו 50% מהפעולות האלה מסתיימות.
תפוקה כמות הנתונים הלא דחוסים שנקראו מהמופע או מהמסד הנתונים או נכתבו אליהם בכל שנייה. הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.
פעולות לשנייה מספר הפעולות בשנייה (קצב) של קריאה וכתיבה במופע או במסד נתונים שנבחר.
השימוש בנפח האחסון ברמת המופע, זהו אחוז ניצול האחסון הכולל בתוך מופע. ברמת מסד הנתונים, זהו סך נפח האחסון שמשמש את מסד הנתונים שנבחר.

תרשימים ומדדים זמינים

התרשים הבא מציג מדד לדוגמה, ניצול המעבד לפי סוג הפעולה:

צילום מסך של תרשים השימוש במעבד לפי סוג פעולה, עם רכיבים שמתוארים בקטע הבא.

סרגל הכלים בכל תרשים כולל את האפשרויות הסטנדרטיות הבאות. חלק מהרכיבים מוסתרים אלא אם מחזיקים את הסמן מעל התרשים.

  • כדי להגדיל חלק מסוים בתרשים, גוררים את מצביע העכבר על החלק שרוצים לראות. הפעולה הזו מגדירה טווח זמן מותאם אישית, שאפשר לשנות או לבטל באמצעות המסנן Time range.

  • כדי לראות תיאור של התרשים והנתונים שלו, לוחצים על הסמל .

  • כדי לראות את המסננים והקיבוצים שמוחלים על התרשים, לוחצים על .

  • כדי ליצור התראה על סמך הנתונים בתרשים, לוחצים על .

  • כדי לעיין בנתונים בתרשים, לוחצים על הסמל .

  • כדי לראות עוד אפשרויות לתרשים, לוחצים על עוד אפשרויות לתרשים.

    • כדי להציג תרשים במסך מלא, לוחצים על הצגה במסך מלא. כדי לצאת ממסך מלא, לוחצים על ביטול או מקישים על Esc.

    • כדי להרחיב או לכווץ את המקרא של התרשים, לוחצים על הרחבה או כיווץ של המקרא של התרשים.

    • כדי להוריד את התרשים, לוחצים על הורדה ובוחרים פורמט להורדה.

    • כדי לשנות את הפורמט החזותי של התרשים, לוחצים על מצב ובוחרים מצב תצוגה.

    • כדי לראות את המדד ב-Metrics Explorer, לוחצים על View in Metrics Explorer. אפשר לראות מדדים אחרים של Spanner ב-Metrics Explorer אחרי שבוחרים את סוג המשאב Spanner Database.

בטבלה הבאה מתוארים התרשימים שמופיעים כברירת מחדל בלוח הבקרה 'תובנות לגבי המערכת'. סוג המדד של כל תרשים מופיע ברשימה. מחרוזות של סוגי מדדים מתחילות בקידומת הבאה: spanner.googleapis.com/. סוג המדד מתאר מדידות שאפשר לאסוף ממשאב במעקב.

שם התרשים וסוג המדד
תיאור זמין למופעים זמין למסדי נתונים


ציר זמן של תקינות קוורום בשני אזורים


instance/dual_region_quorum_availability

התרשים הזה מוצג רק עבור הגדרות של מופעים עם שני אזורים. הוא מציג את תקינותם של שלושה קוורומים: הקוורום בשני אזורים (Global) והקוורום החד-אזורי בכל אזור (לדוגמה, Sydney ו-Melbourne).

אם יש שיבוש בשירות, מוצג פס כתום בציר הזמן. אפשר להעביר את העכבר מעל הסרגל כדי לראות את זמני ההתחלה והסיום של השיבוש. אפשר להשתמש בתרשים הזה לצד שיעורי השגיאות ומדדי זמן האחזור כדי לקבל החלטות לגבי ניהול עצמי של מעבר לגיבוי בעת כשל אזורי. מידע נוסף זמין במאמר בנושא מעבר לגיבוי (Failover) וחזרה מגיבוי (Failback).

כדי לבצע מעבר לגיבוי פעיל וחזרה מגיבוי פעיל באופן ידני, אפשר לעיין במאמר בנושא שינוי קוורום בשני אזורים.



ניצול המעבד (CPU) לפי עדיפות


instance/cpu/utilization_by_priority

אחוז משאבי ה-CPU של המופע למשימות בעדיפות גבוהה, בינונית או נמוכה. המשימות האלה כוללות בקשות שאתם יוזמים ומשימות תחזוקה ש-Spanner צריך להשלים במהירות.

במקרים של מופעים בשני אזורים או במספר אזורים, המדדים מקובצים לפי האזור והעדיפות.

מידע נוסף על משימות בעדיפות גבוהה
מידע נוסף על ניצול המעבד




ניצול המעבד לפי אזור


instance/cpu/utilization_by_priority
השימוש במעבד המרכזי במופע או במסד הנתונים שנבחרו, מקובץ לפי אזור.



ניצול המעבד לפי מסד נתונים


instance/cpu/utilization_by_priority
ניצול המעבד במופע שנבחר, מקובץ לפי מסד נתונים ואזור.



ניצול המעבד (CPU) לפי משתמש/מערכת


instance/cpu/utilization_by_priority
השימוש במעבד במופע או במסד הנתונים שנבחרו, מקובץ לפי משימות של משתמשים ומשימות של המערכת, ולפי עדיפות.


ניצול המעבד (CPU) לפי סוג הפעולה


instance/cpu/utilization_by_operation_type

תרשים עמודות מוערמות של ניצול המעבד באחוזים ממשאבי המעבד של המכונה, מקובצים לפי פעולות שהמשתמש יזם, כמו קריאות, כתיבות והתחייבויות. אפשר להשתמש במדד הזה כדי לקבל פירוט של השימוש במעבד (CPU) ולפתור בעיות נוספות, כמו שמוסבר במאמר בדיקת ניצול גבוה של המעבד.

אפשר גם לסנן לפי עדיפות המשימות באמצעות רשימת האפשרויות.

במקרים של מופעים בשני אזורים או במספר אזורים, המדדים בתרשים הקווים מציגים את אחוז הממוצע בין האזורים.



ניצול המעבד (ממוצע נע ב-24 שעות)


instance/cpu/smoothed_utilization

ממוצע נע של סה"כ השימוש במעבד של Spanner, כאחוז ממשאבי המעבד של המופע, לכל מסד נתונים. כל נקודה על הגרף מייצגת ממוצע של 24 השעות האחרונות.



זמן אחזור


api/request_latencies

משך הזמן שחלף עד ש-Spanner טיפל בבקשת קריאה או כתיבה. המדידה הזו מתחילה כש-Spanner מקבל בקשה, ומסתיימת כש-Spanner מתחיל לשלוח תגובה.

אפשר להציג מדדי חביון עבור אחוזון החביון ה-50 וה-99 באמצעות רשימת האפשרויות.



זמן האחזור לפי מסד נתונים


api/request_latencies

משך הזמן שחלף מרגע ש-Spanner קיבל בקשת קריאה או כתיבה ועד לטיפול בה, מקובץ לפי מסד נתונים. המדידה הזו מתחילה כש-Spanner מקבל בקשה, ומסתיימת כש-Spanner מתחיל לשלוח תגובה.

כדי לראות את מדדי חביון האחוזון ה-50 וה-99, צריך להשתמש ברשימת התצוגה בתרשים הזה.



זמן האחזור לפי שיטת API


api/request_latencies

הזמן שלקח ל-Spanner לטפל בבקשה, מקובץ לפי שיטות Spanner API. המדידה הזו מתחילה כש-Spanner מקבל בקשה, ומסתיימת כש-Spanner מתחיל לשלוח תגובה.

כדי לראות את מדדי השהיות באחוזון ה-50 ובאחוזון ה-99, אפשר להשתמש ברשימת התצוגה בתרשים הזה.




חביון של טרנזקציות


api/request_latencies_by_transaction_type

משך הזמן שנדרש ל-Spanner לעיבוד עסקה. אתם יכולים לבחור להציג מדדים עבור טרנזקציות מסוג קריאה-כתיבה וקריאה בלבד.

ההבדל העיקרי בין תרשים ההשהיה לבין תרשים ההשהיה של העסקאות הוא שבתרשים ההשהיה של העסקאות אפשר לראות את מעורבות הלידים בסוג הקריאה בלבד. יכול להיות שזמן האחזור של פעולות קריאה שכוללות את הלידר יהיה ארוך יותר. אפשר להשתמש בתרשים הזה כדי להעריך אם כדאי להשתמש בקריאות לא עדכניות בלי לתקשר עם הלידר, בהנחה שהגבלת חותמת הזמן היא לפחות 15 שניות. בעסקאות קריאה-כתיבה, תמיד יש מעורבות של ה-leader בעסקה, ולכן הנתונים שמוצגים בתרשים תמיד כוללים את הזמן שנדרש לבקשה להגיע ל-leader ולקבל תשובה. המיקום תואם לאזור של הקצה הקדמי של Cloud Spanner API.

כדי לראות את מדדי השהיות באחוזון ה-50 ובאחוזון ה-99, אפשר להשתמש ברשימת התצוגה בתרשים הזה.



זמן אחזור של עסקאות לפי מסד נתונים


api/request_latencies_by_transaction_type

משך הזמן שנדרש ל-Spanner לעיבוד עסקה.

ההבדל העיקרי בין תרשים זמן האחזור לבין תרשים זמן האחזור של העסקאות לפי מסד הנתונים הוא שבתרשים זמן האחזור של העסקאות לפי מסד הנתונים אפשר לראות את מעורבות הלידים בסוג הקריאה בלבד. יכול להיות שזמן האחזור יהיה ארוך יותר לקריאות שכוללות את הלידר. אתם יכולים להשתמש בתרשים הזה כדי להעריך אם כדאי להשתמש בקריאות לא עדכניות בלי לתקשר עם ה-leader, בהנחה שהגבלת חותמת הזמן היא לפחות 15 שניות. בעסקאות קריאה-כתיבה, תמיד יש מעורבות של ה-leader בעסקה, ולכן הנתונים שמוצגים בתרשים תמיד כוללים את הזמן שנדרש לבקשה להגיע ל-leader ולקבל תשובה. המיקום תואם לאזור של הקצה הקדמי של Cloud Spanner API.

כדי לראות את מדדי השהיות באחוזון ה-50 ובאחוזון ה-99, אפשר להשתמש ברשימת התצוגה בתרשים הזה.




זמן האחזור של העסקאות לפי שיטת API


api/request_latencies_by_transaction_type

משך הזמן שנדרש ל-Spanner לעיבוד עסקה.

ההבדל העיקרי בין תרשים השהייה לבין תרשים השהייה של העסקאות לפי שיטת API הוא שתרשים השהייה של העסקאות לפי שיטת API מאפשר לכם לראות את מעורבות הלידר בסוג הקריאה בלבד. יכול להיות שזמן האחזור יהיה ארוך יותר בפעולות קריאה שכוללות את הליבה הראשית. אתם יכולים להשתמש בתרשים הזה כדי להעריך אם כדאי להשתמש בקריאות לא עדכניות בלי לתקשר עם הלידר, בהנחה שהחותמת של הגבול היא לפחות 15 שניות. בעסקאות קריאה-כתיבה, תמיד יש מעורבות של ה-leader בעסקה, ולכן הנתונים שמוצגים בתרשים תמיד כוללים את הזמן שחלף מהרגע שבו הבקשה הגיעה ל-leader ועד לרגע שבו התקבלה תשובה. המיקום תואם לאזור של הקצה הקדמי של Cloud Spanner API.



פעולות בשנייה


api/api_request_count

מספר פעולות הקריאה והכתיבה ש-Spanner מבצעת בכל שנייה, או מספר שגיאות השרת של Spanner בכל שנייה.

אפשר לבחור אילו פעולות יוצגו בתרשים הזה:
  • קריאה וכתיבה (כולל שגיאות קריאה וכתיבה)
  • שגיאות בשרת Spanner (מקובצות לפי קריאה וכתיבה)



Operations per second by database


api/api_request_count

מספר פעולות הקריאה והכתיבה ש-Spanner מבצעת בכל שנייה, או מספר שגיאות השרת של Spanner בכל שנייה. התרשים הזה מקובץ לפי מסד נתונים.

אפשר לבחור אילו פעולות יוצגו בתרשים הזה:
  • קריאה וכתיבה (כולל שגיאות קריאה וכתיבה)
  • שגיאות בשרת Spanner (מקובצות לפי קריאה וכתיבה)



פעולות לשנייה לפי שיטת API


api/api_request_count

מספר הפעולות ש-Spanner ביצע בכל שנייה, מקובצות לפי שיטת Spanner API



Throughput


api/sent_bytes_count (read)

api/received_bytes_count (write)

כמות הנתונים הלא דחוסים שנקראים מתוך מסד הנתונים או נכתבים אליו בכל שנייה. הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.

התפוקה של קריאה כוללת בקשות ותגובות לשיטות בread API ולשאילתות SQL. הוא כולל גם בקשות ותגובות של משפטי DML.

התפוקה של פעולות כתיבה כוללת בקשות ותגובות לשליחת נתונים באמצעות mutation API. הוא לא כולל בקשות ותגובות לפקודות DML.



Throughput by database


api/sent_bytes_count (read)

api/received_bytes_count (write)

כמות הנתונים הלא דחוסים שנקראו מהמופע ונכתבו אליו בכל שנייה, מקובצים לפי מסד נתונים. הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.

התפוקה של קריאה כוללת בקשות ותגובות לשיטות בread API ולשאילתות SQL. הוא כולל גם בקשות ותגובות של משפטי DML.

התפוקה של פעולות כתיבה כוללת בקשות ותגובות לשליחת נתונים באמצעות mutation API. הוא לא כולל בקשות ותגובות לפקודות DML.



Throughput by API method


api/sent_bytes_count (read)

api/received_bytes_count (write)

כמות הנתונים הלא דחוסים שנקראו מהמופע או ממסד הנתונים, או שנכתבו למופע או למסד הנתונים, בכל שנייה, מקובצים לפי שיטת API. הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.

התפוקה של קריאה כוללת בקשות ותגובות לשיטות בread API ולשאילתות SQL. הוא כולל גם בקשות ותגובות של משפטי DML.

התפוקה של פעולות כתיבה כוללת בקשות ותגובות לשליחת נתונים באמצעות mutation API. הוא לא כולל בקשות ותגובות לפקודות DML.



נפח אחסון כולל


instance/storage/used_bytes

כמות הנתונים שמאוחסנת במסד הנתונים. הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.



Total database storage by database


instance/storage/used_bytes

כמות הנתונים שמאוחסנים במופע, מקובצים לפי מסד נתונים. הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.



נפח אחסון כולל לגיבוי


instance/backup/used_bytes

כמות הנתונים שמאוחסנים בגיבויים שמשויכים למסד הנתונים. הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.



זמן המתנה לנעילה


lock_stat/total/lock_wait_time

זמן ההמתנה לנעילה של עסקה הוא הזמן שנדרש כדי לקבל נעילה של משאב שנמצא בשימוש של עסקה אחרת.

זמן ההמתנה הכולל לנעילה עבור lock מחלוקות מתועד עבור כל מסד הנתונים.



זמן ההמתנה לנעילה לפי מסד נתונים


lock_stat/total/lock_wait_time

זמן ההמתנה לנעילה של עסקה הוא הזמן שנדרש כדי לקבל נעילה של משאב שנמצא בשימוש של עסקה אחרת, מקובץ לפי מסד נתונים.

זמן ההמתנה הכולל לנעילה עבור lock conflicts מתועד עבור כל המופע.



נפח אחסון הגיבוי הכולל לפי מסד נתונים


instance/backup/used_bytes

כמות הנתונים שמאוחסנים בגיבויים שמשויכים למופע, מקובצים לפי מסד נתונים. הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.



קיבולת מחשוב


instance/processing_units
instance/nodes

קיבולת החישוב היא כמות יחידות העיבוד או הצמתים שזמינים במכונה. אפשר לבחור להציג את הקיבולת ביחידות עיבוד או בצמתים.




התפלגות של ה-Leader


instance/leader_percentage_by_region

במקרים של מכונות בשני אזורים או במספר אזורים, אפשר לראות את מספר מסדי הנתונים עם רוב הלידים (‎>=50%) באזור נתון. בתפריט הרשימה Regions (אזורים), אם בוחרים אזור ספציפי, בתרשים מוצג המספר הכולל של מסדי הנתונים במופע הזה שהאזור שנבחר מוגדר בהם כאזור הראשי. אם בוחרים באפשרות All regions בתפריט הרשימה Regions, התרשים מציג קו אחד לכל אזור, וכל קו מציג את המספר הכולל של מסדי הנתונים במופע שמוגדר בו האזור הזה כאזור הראשי.

במסדי נתונים במופע של שני אזורים או מספר אזורים, אפשר לראות את אחוז ה-leaders שמקובצים לפי אזור. לדוגמה, אם במסד נתונים יש חמישה מובילים, אחד ב-us-west1 וארבעה ב-us-east1 בנקודת זמן מסוימת, בתרשים 'כל האזורים' יוצגו שני קווים (אחד לכל אזור). קו אחד של us-west1 נמצא ב-20%, והקו השני של us-east1 נמצא ב-80%. בתרשים us-west1 מוצג קו יחיד ב-20%, ובתרשים us-east1 מוצג קו יחיד ב-80%.

שימו לב: אם מסד נתונים נוצר לאחרונה או שאזור ראשי שונה לאחרונה, יכול להיות שהתרשימים לא יתייצבו מיד.

התרשים הזה זמין רק למופעים של שני אזורים או מספר אזורים.



ציון שיא השימוש ב-CPU


instance/peak_split_peak
השימוש המקסימלי במעבד שחולק בין כל הפיצולים במסד נתונים. המדד הזה מציג את אחוז המשאבים של יחידת העיבוד שנעשה בהם שימוש בפיצול. אחוז של מעל 50% הוא פיצול חם, כלומר הפיצול משתמש במחצית מהמשאבים של יחידת העיבוד של שרת המארח. אחוז של 100% הוא פיצול חם, כלומר פיצול שמשתמש ברוב משאבי יחידת העיבוד של שרת המארח. ‫Spanner משתמש בפיצול מבוסס-עומס כדי לפתור בעיות של נקודות חמות ולאזן את העומס. עם זאת, יכול להיות ש-Spanner לא יוכל לאזן את העומס, גם אחרי כמה ניסיונות פיצול, בגלל דפוסים בעייתיים באפליקציה. לכן, יכול להיות שיהיה צורך בפתרון בעיות נוסף בנקודות חמות שנמשכות לפחות 10 דקות, ואולי יהיה צורך לבצע שינויים באפליקציה. מידע נוסף זמין במאמר איך מוצאים נקודות חמות בספליטים.



קריאות לשירותים מרחוק


query_stat/total/remote_service_calls_count

מספר הקריאות לשירותים מרוחקים, מקובצות לפי השירות וקודי התגובה.

משיב עם קוד תגובת HTTP, כמו 200 או 500.




זמן אחזור: קריאות לשירותים מרוחקים


query_stat/total/remote_service_calls_latencies

החביון של קריאות לשירותים מרוחקים, מקובצות לפי שירות.

אפשר להציג את מדדי זמן האחזור עבור האחוזון ה-50 וה-99 של זמני האחזור באמצעות רשימת האפשרויות.




שורות שעובדו על ידי שירות מרוחק


query_stat/total/remote_service_processed_rows_count

מספר השורות שעובדו על ידי שירות מרוחק, מקובצות לפי נותן השירות וקודי התגובה.

משיב עם קוד תגובת HTTP, כמו 200 או 500.




זמן אחזור: שורות של שירות מרוחק


query_stat/total/remote_service_processed_rows_latencies

מספר השורות שעובדו על ידי שירות מרוחק, מקובצות לפי השירות וקודי התגובה.

אפשר להציג מדדי חביון עבור אחוזון 50 ואחוזון 99 של ערכי החביון באמצעות רשימת האפשרויות.




Remote service network bytes


query_stat/total/remote_service_network_bytes_sizes

מספר הבייטים ברשת שהועברו עם השירות המרוחק, מקובצים לפי שירות וכיוון.

הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.

הכיוון מתייחס לתנועה שנשלחת או מתקבלת.

אפשר להשתמש ברשימת האפשרויות כדי לראות את המדדים של חילופי בייטים ברשת באחוזון ה-50 ובאחוזון ה-99.




קריאות לשירותי מיקרו


query_stat/total/remote_service_calls_count
מספר הקריאות לשירותי מיקרו, מקובצות לפי שירות מיקרו וקוד תגובה.



זמן אחזור: קריאות לשירותי מיקרו


query_stat/total/remote_service_calls_latencies
זמני האחזור של קריאות לשירותי מיקרו, מקובצים לפי שירות מיקרו.


Database storage by table


(none)

כמות הנתונים שמאוחסנים במופע או במסד הנתונים, מקובצים לפי טבלאות במסד הנתונים שנבחר. הערך הזה נמדד בבייטים בינאריים, כמו KiB,‏ MiB או GiB.

הנתונים בתרשים הזה מתקבלים משאילתה של SPANNER_SYS.TABLE_SIZES_STATS_1HOUR. מידע נוסף זמין במאמר בנושא נתונים סטטיסטיים על גדלי טבלאות.



Most-used tables by operations


(none)

‫15 הטבלאות והאינדקסים שהכי הרבה משתמשים בהם במופע או במסד הנתונים, לפי מספר הפעולות של קריאה, כתיבה או מחיקה.
הנתונים בתרשים הזה מתקבלים משאילתות על טבלאות הנתונים הסטטיסטיים של פעולות הטבלה. מידע נוסף מופיע בקטע נתונים סטטיסטיים של פעולות בטבלה.



Least-used tables by operations


(none)

‫15 הטבלאות והאינדקסים שהשימוש בהם הכי נמוך במופע או במסד הנתונים, לפי מספר פעולות הקריאה, הכתיבה או המחיקה.
הנתונים בתרשים הזה מתקבלים משאילתות על טבלאות הנתונים הסטטיסטיים של פעולות הטבלה. מידע נוסף מופיע בקטע נתונים סטטיסטיים של פעולות בטבלה.


תרשימים ומדדים של קנה מידה אוטומטי מנוהל

המדדים הבאים זמינים למופעים שבהם מופעל המידרוג האוטומטי המנוהל.

שם המדד וסוג המדד תיאור
ניצול המעבד (CPU) לפי הגדרות של התאמה אוטומטית לעומס אחוז ניצול המעבד בזמן אמת ובמכונת הבסיס, ורפליקות לקריאה בלבד ומחיצות של מכונות עם התאמה אוטומטית לעומס.

אפשר להשתמש בתפריטים הנפתחים כדי לבחור את מסד הנתונים הספציפי, את מחיצת המופע ואת האזור שיוצגו בתרשים. בתרשים מוצגים יעדי ניצול המעבד כקווים מקווקווים. קווים מלאים מציגים את אחוזי הניצול בזמן אמת.
קיבולת מחשוב כשצמתים נבחרים.

instance/autoscaling/min_node_count

המספר המינימלי של צמתים שהמידרוג האוטומטי מוגדר להקצות למופע.

instance/autoscaling/max_node_count
המספר המקסימלי של צמתים שהמידרוג האוטומטי מוגדר להקצות למופע.

instance/autoscaling/recommended_node_count_for_cpu

מספר הצמתים המומלץ על סמך השימוש במעבד של המופע.

instance/autoscaling/recommended_node_count_for_storage

מספר הצמתים המומלץ על סמך נפח האחסון הנדרש של המופע.
קיבולת מחשוב עם יחידות עיבוד שנבחרו.

instance/autoscaling/min_processing_units

המספר המינימלי של יחידות העיבוד שהמידרוג האוטומטי מוגדר להקצות למופע.

instance/autoscaling/max_processing_units

המספר המקסימלי של יחידות עיבוד שהמידרוג האוטומטי מוגדר להקצות למופע.

instance/autoscaling/recommended_processing_units_for_cpu

מספר יחידות העיבוד המומלץ. ההמלצה הזו מבוססת על השימוש הקודם במעבד של המופע.

instance/autoscaling/recommended_processing_units_for_storage

מספר יחידות העיבוד המומלץ לשימוש. ההמלצה הזו מבוססת על נפח האחסון הנדרש הקודם של המופע.
ניצול המעבד לפי עדיפות

instance/autoscaling/high_priority_cpu_utilization_target

יעד ניצול המעבד (CPU) בעדיפות גבוהה לשימוש בהתאמה אוטומטית לעומס.

instance/autoscaling/total_cpu_utilization_target
replica/autoscaling/total_cpu_utilization_target

יעד כולל של ניצול המעבד לשימוש בהתאמה אוטומטית לעומס. המדד 'סך השימוש במעבד' כולל את כל המשימות בעדיפות נמוכה, בינונית וגבוהה.
נפח אחסון כולל עם יחידות עיבוד שנבחרו.

instance/storage/limit_bytes

מגבלת האחסון של המופע בבייטים.

instance/autoscaling/storage_utilization_target

יעד ניצול האחסון לשימוש בהתאמה אוטומטית לעומס.

תרשימים ומדדים של אחסון לפי רמות

המדדים הבאים זמינים למופעים שמשתמשים באחסון מדורג.

שם המדד וסוג המדד תיאור
instance/storage/used_bytes סה"כ בייט של נתונים שמאוחסנים באחסון SSD ו-HDD.
instance/storage/combined/limit_bytes מגבלות אחסון משולבות של SSD ו-HDD.
instance/storage/combined/limit_per_processing_unit מגבלת האחסון המשולבת של SSD ו-HDD לכל יחידת עיבוד.
instance/storage/combined/utilization שטח האחסון הכולל שנוצל בכונני ה-SSD וה-HDD, בהשוואה למגבלת האחסון הכוללת.
instance/disk_load עומס השימוש ב-HDD.

שמירת נתונים

תקופת שמירת הנתונים המקסימלית של רוב המדדים בלוח הבקרה של תובנות המערכת היא 6 שבועות. עם זאת, בתרשים Database storage by table, הנתונים נלקחים מהטבלה SPANNER_SYS.TABLE_SIZES_STATS_1HOUR (במקום מ-Spanner), שבה תקופת השמירה המקסימלית היא 30 ימים. מידע נוסף על שמירת נתונים

הצגת מרכז הבקרה של תובנות המערכת

כדי לצפות בדף 'תובנות לגבי המערכת', אתם צריכים את ההרשאות הבאות של ניהול הזהויות והרשאות הגישה (IAM), בנוסף להרשאות של Spanner והרשאות של Spanner ברמת המופע וברמת מסד הנתונים:

  • spanner.databases.beginReadOnlyTransaction
  • spanner.databases.select
  • spanner.sessions.create

מידע נוסף על הרשאות IAM ב-Spanner זמין במאמר בקרת גישה באמצעות IAM.

אם מפעילים מידרוג אוטומטי מנוהל במופע, צריך גם את ההרשאות logging.logEntries.list,‏ logging.logs.list ו-logging.logServices.list כדי להציג את היומנים של המידרוג האוטומטי המנוהל.

מידע נוסף על ההרשאה הזו זמין במאמר בנושא תפקידים מוגדרים מראש.

כדי להציג את לוח הבקרה של תובנות המערכת, פועלים לפי השלבים הבאים:

  1. במסוף Google Cloud , פותחים את רשימת מופעי Spanner.

    כניסה לרשימת המכונות

  2. מבצעים אחת מהפעולות הבאות:

    1. כדי לראות מדדים של מכונה, לוחצים על השם של המכונה שרוצים לקבל עליה מידע ואז לוחצים על תובנות לגבי המערכת בתפריט הניווט.

    2. כדי לראות מדדים של מסד נתונים, לוחצים על שם המופע, בוחרים מסד נתונים ואז לוחצים על System insights בתפריט הניווט.

  3. אופציונלי: כדי לראות נתונים היסטוריים מתקופת זמן אחרת, מחפשים את הלחצנים בפינה השמאלית העליונה של הדף ולוחצים על תקופת הזמן שרוצים לראות.

  4. אופציונלי: כדי לקבוע אילו נתונים יוצגו בתרשים, לוחצים על אחת מהרשימות בתרשים. לדוגמה, אם המופע משתמש בהגדרה של שני אזורים או של מספר אזורים, בחלק מהתרשימים מוצגת רשימה שמאפשרת לראות נתונים של אזור ספציפי. לא לכל התרשימים יש רשימות צפייה.

המאמרים הבאים