תרחיש לדוגמה: ביקורת על ביצועי הרשת

נניח שאתם מנהלי רשת שתומכים ברשת שכוללת כמה אפליקציות עם איזון עומסים. התבקשת לבדוק את הגדרות הרשת שתומכות באפליקציות האלה כדי לוודא שההגדרות תואמות למצב הצפוי של הרשת. ביצוע הביקורת הזו מאפשר לוודא שהלקוחות נהנים מהשהיה הנמוכה ביותר האפשרית בגישה לאפליקציות שלכם.

תרחיש השימוש הבא ממחיש איך אפשר להיעזר בטופולוגיית הרשת כדי לבדוק את ההגדרות הקיימות. לדוגמה, אפשר לוודא שכל הבקשות של הלקוח מטופלות על ידי מופעי אפליקציה מהאזור הקרוב ביותר ללקוח. Google Cloudאפשר גם לוודא שהתנועה בין אזורים נמוכה, כי התנועה הזו מגיעה ממסדי נתונים שמשכפלים נתונים באופן גלובלי.

סקירה כללית של טופולוגיה

הפריסה מתפרסת על פני שלושה אזורים (us-central1, europe-west1 ו-asia-east1). כל הבקשות של לקוחות חיצוניים מטופלות על ידי מאזן עומסים חיצוני יחיד של אפליקציות (ALB) שיש לו כמה קצה עורפי בכל אחד משלושת האזורים. Google Cloud בקשות של לקוחות שמגיעות מאחד משלושת האזורים העסקיים (אמריקה, EMEA ו-APAC) מטופלות על ידי מופעי אפליקציה באזור הקרוב ביותרGoogle Cloud .

בתרשים הבא מוצגת ההיררכיה ברמה העליונה של הפריסה.

מקורות מידע ונתיבי תנועה

בדוגמה הזו, הפרויקט מכיל את המשאבים הבאים של Google Cloud:

  • מאזן עומסים אחד ב-HTTPS

  • 4 שירותים לקצה העורפי: browse,‏ shopping_cart,‏ checkout וfeeds

  • ‫12 קבוצות של מכונות (שהן הקצוות העורפיים של מאזן העומסים)

    יש קבוצת מכונות אחת לכל שירות לקצה העורפי בכל אחד משלושת האזורים.

  • 3 מופעים של מסד נתונים, אחד בכל אזור

אתם מצפים שתנועת הגולשים ממדינות מסוימות תגיע למיקומים הבאים:

  • תעבורת נתונים ממדינות באזור העסקי Americas מגיעה לשרתי קצה בעורף באזור us-central1. לדוגמה, תעבורת נתונים מלקוח חיצוני בקנדה עוברת דרך מאזן העומסים אל קצה הבק-אנד של checkout באזור us-central1.
  • תעבורת נתונים ממדינות באזור העסקי EMEA מגיעה לשרתי קצה עורפיים באזור europe-west1. לדוגמה, תעבורת נתונים מלקוח חיצוני בפולין עוברת דרך מאזן העומסים אל שרת הבק-אנד checkout באזור europe-west1.
  • תעבורת נתונים ממדינות באזור העסקי APAC מגיעה לשרתי קצה עורפיים באזור asia-east1. לדוגמה, תעבורה מלקוח חיצוני ביפן עוברת דרך מאזן העומסים אל שרת הבק-אנד באזור checkout.asia-east1
  • התנועה למופע של מסד נתונים מגיעה מבק-אנד באותו אזור. לדוגמה, השרתים העורפיים ב-asia-east1 שולחים נתונים רק למופע מסד הנתונים ב-asia-east1.
  • התנועה בין אזורים מוגבלת לשכפול מסדי נתונים. לדוגמה, התנועה בין us-central1 לבין europe-west1 עוברת רק בין מופעי מסד נתונים באזורים האלה.

זרימת תנועה לא צפויה

בתרחיש הזה, אתם מגלים שהתנועה מאזור העסקים EMEA מועברת עכשיו לשני אזורים שונים, Google Cloud ו-us-central1 ו-europe-west1. בעזרת הטופולוגיה של הרשת, אתם מגלים שאחד מהשרתים העורפיים נמצא בשימוש יתר.

  1. אתם רוצים לוודא שתעבורה חיצונית שעוברת דרך מאזן העומסים מגיעה בסופו של דבר לאזור הנכון Google Cloud . מסננים את התרשים כדי להציג רק את התנועה של מאזן העומסים החיצוני shopping-site-lb.

    אחרי שמחילים את המסנן, הטופולוגיה של הרשת מציגה רק את החיבורים שקשורים למאזן העומסים, כמו בדוגמה הבאה.

  2. מעבירים את הסמן מעל כל אזור עסקי כדי להדגיש את התקשורת עם האזור הזה.

    כשמעבירים את מצביע העכבר מעל Americas ו-APAC, רואים את התנועה שמגיעה לאזור הקרוב ביותר: us-central1 ו-asia- east1 בהתאמה. Google Cloud אבל כשמציבים את הסמן מעל EMEA, רואים תנועה שמגיעה אל us-central1 ו-europe-west1. כדי להקטין את זמן האחזור, מומלץ שכל התעבורה מאזור EMEA תעבור דרך europe-west1.

  3. לאחר מכן לוחצים על EMEA כדי לבדוק את קצב העברת הנתונים בין האזור הזה לבין אזוריGoogle Cloud . בטופולוגיה של הרשת מוצגים ערכי רוחב הפס בכל חיבור. אפשר לראות ש-0.58 בייט לשנייה עובר אל us-central1 ו-29.9 קילובייט לשנייה עובר אל europe-west1. אתם יודעים שרוב התנועה מופנית כמו שציפיתם, אבל עומס תנועה קל זורם אל us-central1.

    1הנתון הוא להמחשה בלבד. הנתונים שלה לא משקפים את תרחיש השימוש.

  4. כדי לבדוק את הבעיה לעומק, מרחיבים את us-central1 כדי לראות לאן התנועה מגיעה. מכיוון שיש רק רשת אחת עם רשת משנה אחת באזור הזה, בטופולוגיה של הרשת לא מוצגות הרמות האלה בהיררכיה, והיא מדלגת לקבוצות המופעים.

    אתם רואים שהתעבורה מגיעה לקבוצת מופעים שמשויכת לשירות לקצה העורפי של מאזן העומסים. מכיוון שמדובר בכמות קטנה יחסית של תנועה שמופנית אל europe-west1, יכול להיות שהמשאבים ב-europe-west1 נמצאים בשימוש יתר וגורמים לתנועה לעבור אל us-central1.

    1הנתון הוא להמחשה בלבד. הנתונים שלה לא משקפים את תרחיש השימוש.

  5. כדי לאשר את המסקנה, מרחיבים את האזור europe-west1 עד שמגיעים למופע שמשויך לשירות העורפי של מאזן העומסים. בחלון הפרטים של המופע מוצגים תרשימים של סדרות זמנים בטופולוגיה של הרשת.

    בתרשים, אפשר לראות ששיעור הניצול של המעבד הוא 81% עבור המופע. סף הניצול בדוגמה הזו הוא 80%, מה שמצביע על כך שיש יותר מדי מנויים למופע. כדי לפתור את הבעיה הזו, צריך להגדיל את קבוצת המופעים כדי שהתנועה תחזור לזרימה האידיאלית.

    1הנתון הוא להמחשה בלבד. הנתונים שלה לא משקפים את תרחיש השימוש.

תנועה בין אזורים

בקטע הבא, בודקים שהתנועה הפנימית בין האזורים מוגבלת רק לתנועה של מופע מסד הנתונים.

  1. כדי להתמקד בתנועה פנימית, ברשימה Topology configuration (הגדרת טופולוגיה), מסמנים רק את התיבות Instances (מופעים) ו-Cloud NAT gateways (שערי NAT בענן). מכיוון שאתם צופים רק בתנועה בתוך האפליקציה, אין צורך להציג לקוחות חיצוניים ותנועה של מאזן עומסים חיצוני.

  2. מרחיבים את האזור asia-east1 ורואים חמש קבוצות של מכונות. הם לא מצטברים לפי רשת, תת-רשת או אזור, כי כולם נמצאים באותה רשת, תת-רשת וכו'.

    הבחנתם שרק קבוצת מופעים אחת (db-group-asia) מכילה נתיב לתנועה בין אזורים. כל שאר קבוצות המופעים מתקשרות בתוך האזור.

    ממשיכים להרחיב את הקבוצה db-group-asia עד שמגיעים לישות הבסיסית. בתרחיש הזה, ישות הבסיס היא מכונה וירטואלית (VM) (db-instance-asia) שפועלת כשרת מסד נתונים. הוא מתקשר עם אזורים אחרים כדי לשכפל נתונים, וזה מה שציפית, כך שלא נדרשת בדיקה נוספת. ̦

    1הנתון הוא להמחשה בלבד. הנתונים שלה לא משקפים את תרחיש השימוש.

המאמרים הבאים