מדדים ותצוגות בלוח בקרה לביצועי הענן

בדף הזה מתוארים המדדים שמשמשים לקביעת הביצועים של משאביGoogle Cloud הפרויקט Google Cloudושל הפרויקט כולו. אפשר גם למצוא פרטים על התצוגות השונות שבהן מוצגים פרטים נוספים על מדדי הביצועים האלה.

מדדים

לוח בקרה לביצועי הענן מספק שני סוגים של מדדים: אובדן מנות וחביון (זמן הלוך ושוב, או RTT). כדי לקבל מדדים של אובדן מנות עבורGoogle Cloud הפרויקט, צריך מספר מספיק של מכונות וירטואליות בפרויקט. כדי לקבל מדדי זמן אחזור, צריך נפח תנועה מספיק. בנוסף, לוח בקרה לביצועי הענן אינו דורש הגדרה.

בקטעים הבאים מוסבר על שני המדדים האלה בפירוט.

אובדן מנות

מדדי אובדן המנות מציגים את התוצאות של בדיקה פעילה בין המיקומים הבאים:

  • מכונות וירטואליות ברשת VPC אחת.

  • מכונות וירטואליות ברשתות VPC שמקושרות לרשתות שכנות, כשאחת מהרשתות או שתיהן נמצאות בפרויקט שלכם. אם הרשתות המקושרות נמצאות בפרויקטים שונים, אובדן המנות גלוי בפרויקט היעד.

  • מכונות וירטואליות ברשת VPC משותפת שמשמשת את הפרויקט. אובדן מנות בין שני פרויקטים שמשתמשים ברשת VPC משותפת מופיע בפרויקט השירות של היעד.

לדוגמה, נניח שפרויקט א' כולל שתי רשתות VPC: רשת א', שיש בה מכונות וירטואליות רק באזור א', ורשת מ', שיש בה מכונות וירטואליות רק באזור מ'. אם שתי הרשתות האלה הן רשתות עמיתות, בלוח הבקרה לביצועי הענן של פרויקט א' מוצגים נתוני אובדן המנות של זוג התחומים א'/מ'. אם הרשתות לא מקושרות, לוח בקרה לביצועי הענן לא מציג את מדד אובדן המנות עבור זוג האזורים הזה.

אם שתי הרשתות האלה לא באותו פרויקט, צריך לשים לב מתי מדדי הביצועים מוצגים בלוח בקרה לביצועי הענן של כל רשת. כלומר, נניח שרשת A היא חלק מפרויקט A, ורשת M היא חלק מפרויקט M. כשהרשתות מקושרות בקישור בין רשתות שכנות (peering), בלוח בקרה לביצועי הענן של פרויקט M מוצגים נתונים על אובדן מנות במצבים שבהם אזור M הוא אזור היעד. לעומת זאת, אם אזור א' הוא אזור היעד, נתוני אובדן המנות גלויים רק בפרויקט א'. אם הרשתות לא מקושרות, לא יוצגו נתונים של אובדן מנות לגבי זוג האזורים בלוח בקרה לביצועי הענן של אף אחד מהפרויקטים.

הנתונים שנאספים מכל הבדיקות מצטברים בלוח בקרה לביצועי הענן. כלומר, לוח בקרה לביצועי הענן לא מאפשר לכם לבודד נתונים לגבי אובדן מנות בתוך פרויקט לעומת סוגים אחרים (כמו אובדן מנות שקשור לרשת VPC עם קישור בין רשתות שכנות (peering) בפרויקט אחר). אבל אפשר להשתמש ב-Monitoring כדי לראות תוצאות מפורטות יותר. מידע נוסף זמין במאמר בנושא מדדים בלוח בקרה לביצועי הענן.

לוח בקרה לביצועי הענן לא שולח בדיקות דרך חיבורי Cloud VPN.

מתודולוגיה

לוח בקרה לביצועי הענן מפעיל תהליכי עבודה במארחים הפיזיים שבהם נמצאים המכונות הווירטואליות שלכם. העובדים האלה מוסיפים ומקבלים מנות בדיקה שפועלות באותה רשת כמו התנועה שלכם. העובדים פועלים במארחים הפיזיים ולא במכונות הווירטואליות, ולכן הם לא צורכים משאבים של מכונות וירטואליות, והתנועה לא גלויה במכונות הווירטואליות.

הבדיקות מכסות את כל רשת המכונות הווירטואליות שיכולות לתקשר זו עם זו, אבל זה לא בהכרח אותו הדבר כמו דפוס התעבורה שלכם. לכן, יכול להיות שתראו בלוח בקרה לביצועי הענן אינדיקציות לאובדן מנות, אבל לא תמצאו הוכחות לאובדן מנות באפליקציה שלכם.

לכל המכונות הווירטואליות שנבדקות, Google Cloud מנסה לגשת למכונה הווירטואלית באמצעות כתובת ה-IP הפנימית וכתובת ה-IP החיצונית שלה (אם קיימת כזו). הבדיקות לא יוצאות מ- Google Cloud, אבל באמצעות כתובות IP חיצוניות, לוח בקרה לביצועי הענן יכול לכסות חלק מהנתיב שמשמש תעבורה חיצונית, כמו תעבורה שמגיעה מהאינטרנט.

אובדן מנות לכתובות IP פנימיות נמדד באמצעות מנות UDP, ואובדן מנות לכתובות IP חיצוניות נמדד באמצעות מנות TCP.

זמינות המדדים ורמות הסמך

לוח בקרה לביצועי הענן בודק קבוצת משנה של כל זוגות ה-VM ברשת. הנתונים שנאספים משמשים להערכת אובדן המנות שאתם עלולים לחוות. רמת הביטחון של Google בנתונים תלויה בקצב הבדיקה, וקצב הבדיקה תלוי במספר המכונות הווירטואליות שיש לכם בכל אזור, וגם במספר האזורים שבהם פרוסות מכונות וירטואליות. לדוגמה, אם יש 10 מכונות וירטואליות בשני אזורים, רמת הביטחון גבוהה יותר מאשר אם יש 10 מכונות וירטואליות ב-10 אזורים.

כל מכונות ה-VM, כולל אלה שנוצרו על ידי Google Kubernetes Engine‏ (GKE), נכללות במספר הכולל של מכונות ה-VM.

בטבלה הבאה מפורטות רמות הסמך השונות. רמות מהימנות נמוכות יותר מסומנות במפת החום בכוכבית (*) או בסימן N/A.

רמה מספר המכונות הווירטואליות הנדרש בכל אזור מה מוצג במפת החום בלוח הבקרה לביצועי הענן
95% 10 מכונות וירטואליות כפול מספר האזורים בפרויקט. לדוגמה, אם יש לכם 12 אזורים בפרויקט, אתם צריכים 120 מכונות וירטואליות בכל אזור. מדידה ללא הערות נוספות
90% ‫2.5 מכונות וירטואליות כפול מספר האזורים בפרויקט. לדוגמה, אם יש לכם 12 אזורים בפרויקט, אתם צריכים 30 מכונות וירטואליות בכל אזור. מדידה ללא הערות נוספות
בסבירות נמוכה מדידה עם כוכבית
אין מספיק בדיקות כדי לקבל נתונים משמעותיים N/A

המדדים של Google Cloud אובדן חבילות זמינים תמיד. אם יש פחות מ-400 בדיקות בדקה, מוצג כוכבית (*).

זמן אחזור ספציפי לפרויקט

מדדי זמן האחזור נמדדים באמצעות תעבורת לקוחות בין:

  • מכונות וירטואליות ברשת VPC אחת
  • מכונות וירטואליות בין רשתות VPC שמקושרות לרשתות שכנות, אם הרשתות נמצאות באותו פרויקט
  • מכונות וירטואליות ונקודות קצה באינטרנט

בנוסף, בלוח בקרה לביצועי הענן בפרויקט שירות ברשת VPC משותפת מוצגים נתונים רק לגבי האזורים בפרויקט השירות. כלומר, נניח שמכונה וירטואלית באזור א' ובפרויקט שירות א' משתמשת בפרויקט המארח כדי לתקשר עם מכונה וירטואלית באזור ב' ובפרויקט שירות ב'. נתוני המדידה לגבי התנועה הזו לא זמינים לפרויקט השירות או לפרויקט המארח.

Google Cloud זמן אחזור

מדדי זמן האחזור נמדדים באמצעות תנועת לקוחות בפועל בין:

  • מכונות וירטואליות ברשת VPC אחת
  • מכונות וירטואליות בין רשתות VPC שמקושרות לרשתות שכנות
  • מכונות וירטואליות ונקודות קצה באינטרנט

מתודולוגיה לחישוב זמן האחזור של פרויקט ושל Google Cloud

זמן האחזור נמדד באמצעות מנות TCP.

החביון מחושב על סמך מדגם של התנועה בפועל, כזמן שחלף בין שליחת מספר רצף TCP‏ (SEQ) לבין קבלת ACK תואם שמכיל את זמן ה-RTT ברשת והשהיה שקשורה למערך TCP.

הדגימה וההתנהגות של האפליקציה משפיעות על מועד התיעוד של ACK, ולכן מדד זמן האחזור עשוי לכלול גם עיכובים ברמת האפליקציה. מידע נוסף זמין במאמר בנושא אנומליות במדד זמן האחזור. במאמר סקירה קצרה של זמן הלוך ושוב מוסבר איך חביון של אפליקציה משפיע על RTT.

במרכז הבקרה מוצג זמן האחזור כממוצע של כל המדידות הרלוונטיות.

מדד ההשהיה מבוסס על אותו מקור נתונים ועל אותה מתודולוגיית דגימה כמו יומני הזרימה של VPC.

החביון הספציפי לפרויקט מבוסס על דוגמאות מהפרויקט. החביוןGoogle Cloud מבוסס על דגימות מכל Google Cloud.

מדדי ההשהיה הגלובלית נגזרים מדגימה פסיבית של כותרות תנועת TCP, ולא באמצעות בדיקה פעילה מנקודות קצה באינטרנט. Google Cloud

חריגות במדד זמן האחזור

שימו לב לחריגות הבאות במדד זמן האחזור:

  • בסביבות עם קצב נמוך, Network Intelligence Center משתמש בבדיקות של שישים שניות למדדי השהיה. לכן, מדדי RTT שמבוססים על דגימת מנות עשויים לדווח באופן שגוי על רמות חביון גבוהות כששירותים מבוססי TCP מחזירים תגובה ברמת האפליקציה עם עיכוב. בדרך כלל אפשר לזהות רמות לא מדויקות של זמן תגובה (RTT) על ידי בדיקה אם הן תואמות לעיכובים ברמת האפליקציה.

    למרות שהשירות מבוסס ה-TCP מגיב במהירות עם ACK, הדגימה מפספסת את ACK וסופרת תגובת נתונים מאוחרת יותר כסגירה ACK לשליחה מוקדמת הרבה יותר, מה שגורם להטיה במדידת ה-RTT הכוללת. במקרים כאלה, צריך לאמת את זמן האחזור באמצעות מקור נתונים אחר (לדוגמה, בדיקת ping). אם זמן ה-RTT שמוצג נמוך יותר, צריך לבדוק את מהירות התגובה של האפליקציה.

  • לפעמים נתוני ההשהיה הספציפיים לפרויקט לא תואמים לנתוני ההשהיה הגלובליים. חוסר התאמה כזה יכול לקרות אם מערך הנתונים הגלובלי כולל גם נתיבי רשת אחרים עם השהיות שונות באופן משמעותי ביחס לנתיב הרשת שבו נעשה שימוש בפרויקט הספציפי.

זמינות המדדים

מדד Google Cloud ההשהיה זמין תמיד. מדד זמן האחזור לכל פרויקט זמין רק אם תעבורת ה-TCP היא בסביבות 1,000 מנות נתונים לדקה או יותר.

טבלת סיכום המדדים

בטבלה הבאה מופיע סיכום של שיטות הבדיקה והפרוטוקולים שמשמשים לדיווח על מדדי אובדן מנות וזמן האחזור.

אובדן מנות זמן אחזור
שיטת הבדיקה בדיקה פעילה (תעבורת נתונים סינתטית של מכונות וירטואליות) בדיקה פסיבית (תעבורת נתונים בפועל של מכונה וירטואלית)
פרוטוקול ‫UDP (כתובת IP פנימית), TCP (כתובת IP חיצונית) ‫TCP (כתובות IP פנימיות/חיצוניות)

תצוגות של זמן האחזור

פרטי זמן האחזור של סוג התנועה Internet to Google Cloud זמינים בשלוש תצוגות: טבלה, מפה וציר זמן.

תצוגת טבלה

בתצוגת Table מוצג חציון ה-RTT בין האזורים הגיאוגרפיים שנבחרו לבין האזורים שמכילים מכונות וירטואליות בפרויקט. הטבלה כוללת את הפרטים הבאים:

  • מדינה: שם המדינה.
  • ערים: מספר הערים. אפשר לראות את פרטי זמן האחזור של כל עיר ספציפית בתרשים הפרטים של המדינה.
  • אזורי יעד: מספר אזורי היעד עם תנועה של משתמשים ממדינה מסוימת.
  • זמן האחזור החציוני: זמן ה-RTT החציוני, באלפיות השנייה, בין המדינה לאזורים.

תצוגת מפה

בתצוגת מפה מוצגים המיקומים הגיאוגרפיים (אזורים מטרופוליניים או ערים) וGoogle Cloud האזורים.

  • צפייה בחביון הממוצע של מיקומים ואזורים ספציפיים. Google Cloud
  • בוחרים Google Cloud אזור ורואים את המיקומים עם תנועה לאזור שנבחר.
  • אפשר לראות פרטים ספציפיים למיקום בתרשים חביון בסרגל הצד.
  • מחפשים מיקומים באמצעות תיבת החיפוש במפה.

המיקומים מקבלים צבעים שונים של כחול כדי לציין את טווחי חציון זמן האחזור במפה. בתמונה הבאה, הצבע של עיגול שמציג עיר מסוימת במפה גלובלית יכול להיות גוון אחד של כחול. ככל שגוון הכחול כהה יותר, כך זמן האחזור של העיר הזו גדול יותר מאזור Google Cloud מסוים.

טווחים של חביון חציוני במפה.
טווחים של זמן אחזור חציוני במפה (לחצו כדי להגדיל).

תצוגת ציר הזמן

בתצוגה ציר זמן מוצג חציון ה-RTT בין האזורים הגיאוגרפיים שנבחרו לבין אזורי Google Cloud . הוא מספק את מדדי זמן האחזור הנוכחיים ונתונים היסטוריים מ-6 שבועות. אפשר להשתמש במסננים כדי לצבור את נתוני התנועה ברמת העיר, האזור הגיאוגרפי והמדינה. אפשר לראות את מדדי זמן האחזור שמתאימים לזוגות ספציפיים של אזור ומיקום גיאוגרפי רק אם יש מספיק תנועה לזוג הזה. Google Cloud