זיהוי עומסי עבודה עם הקצאת יתר או הקצאת חסר של משאבים

במאמר הזה מוסבר איך לזהות עומסי עבודה (workload) שמוקצים להם משאבים בחוסר או בעודף, שפועלים באשכולות Google Kubernetes Engine ‏(GKE), באמצעות תובנות והמלצות. אחרי שתוודאו שההמלצה להגדלה או להקטנה של נפח העבודה תועיל לעומסי העבודה שזוהו, תוכלו לבצע את השינוי המומלץ כדי לחסוך בעלויות או כדי לשפר את המהימנות של עומס העבודה. אם אפשר, ההמלצה כוללת את החיסכון או העלות החודשיים הצפויים. מידע נוסף מופיע במאמר הסבר על אומדני עלויות או חיסכון.

‫GKE מספק את התובנות האלה לגבי עומסי עבודה שפועלים באשכולות Autopilot ו-Standard. ‫GKE גם מספק המלצות דומות לגבי אשכולות שלמים. מידע נוסף זמין במאמר בנושא זיהוי אשכולות GKE עם הקצאת יתר או הקצאה חסרה של משאבים.

‫GKE עוקב אחרי האשכולות שלכם ומספק הנחיות לאופטימיזציה של השימוש באמצעות Active Assist, שירות שמספק המלצות ליצירת תובנות והמלצות לשימוש במשאבים ב- Google Cloud. מידע נוסף על ניהול תובנות והמלצות זמין במאמר אופטימיזציה של השימוש ב-GKE באמצעות תובנות והמלצות.

קבלת תובנות והמלצות לגבי עומסי עבודה עם הקצאת יתר או הקצאת חסר

אפשר לקבל את התובנות וההמלצות האלה דרך Google Cloud CLI או Recommender API. פועלים לפי ההוראות המתאימות כדי לראות תובנות והמלצות ולסנן לפי סוגי המשנה WORKLOAD_UNDERPROVISIONED ו-WORKLOAD_OVERPROVISIONED.

אחרי שמזהים עומסי עבודה עם הקצאת יתר או הקצאת חסר של משאבים, כדאי לעיין בשיקולים כשמתאימים את גודל עומסי העבודה.

איך GKE מזהה עומסי עבודה עם הקצאת יתר ועומסי עבודה עם הקצאת חסר

בטבלה הבאה מתוארים האותות ש-GKE משתמש בהם כדי לזהות עומסי עבודה עם הקצאת יתר או הקצאת חסר של משאבים, שאפשר להגדיל או להקטין את קנה המידה שלהם, וגם סף הערך של כל אות. בנוסף, בטבלה הזו מוצגת הפעולה המומלצת לביצוע בתרחיש הזה.

סוג משנה אות תקופת התצפית פרטים המלצה
WORKLOAD_UNDERPROVISIONED השימוש במעבד (CPU) או בזיכרון גבוה ב-15 הימים האחרונים עומס עבודה מוקצה בחוסר אם ניצול ה-CPU או הזיכרון גבוה מ-150% לפחות ב-10% מהזמן ב-15 הימים האחרונים. הגדלת נפח העבודה כדי לשפר את המהימנות
WORKLOAD_OVERPROVISIONED השימוש במעבד או בזיכרון נמוך ב-15 הימים האחרונים עומס עבודה מוקצה יתר על המידה אם ניצול ה-CPU או הזיכרון נמוך מ-50% לפחות ב-90% מהזמן במהלך 15 הימים האחרונים. הקטנת עומס העבודה כדי לחסוך בעלויות

בנוסף, מערכת GKE משתמשת בהנחיות הבאות כדי לקבוע מתי לספק תובנות והמלצות:

  • GKE לא יוצר המלצות למדד היעד של התאמה אופקית של קבוצות Pod לעומס (HPA), כי שימוש במדד הזה עלול לגרום להפרעות.
  • אם מופעלת התאמה אנכית של קבוצות Pod לעומס (VPA), ערכי הבקשה מנוהלים באופן אוטומטי ו-GKE לא צריך ליצור המלצה.
  • יכול להיות שיחלפו עד שלושה ימים עד ש-GKE ייצור המלצות לגבי עומסי עבודה חדשים.

הסבר על הערכות עלויות או חיסכון

אם אפשר, ההמלצה של GKE כוללת אומדן של העלות החודשית או החיסכון החודשי אם תשנו את גודל עומס העבודה. ההערכה הזו נגזרת מעלויות עומס העבודה, על סמך הממוצע המשוקלל של ערכי הבקשות בשילוב עם עלות ה-CPU והזיכרון של עומס העבודה ב-30 הימים האחרונים.

כל העלויות או החיסכון המשוערים הם תחזיות שמבוססות על הוצאות קודמות, והם לא מבטיחים עלויות או חיסכון עתידיים.

כדי לראות את האומדנים האלה, צריך לוודא שהתנאים הבאים מתקיימים:

  • יש לכם את הרשאת billing.accounts.getSpendingInformation הנדרשת כדי לקבל מידע על ההוצאות. מידע נוסף מופיע במאמר בנושא גישה לחיוב ב-Cloud.
  • הקצאת העלויות ב-GKE מופעלת באשכול. מידע נוסף זמין במאמר הפעלת הקצאת עלויות ב-GKE.

למידע נוסף על העלות של כל אשכולות GKE, כולל פירוט מפורט יותר לפי מרחבי שמות ועומסי עבודה, אפשר לקרוא את המאמר קבלת תובנות חשובות לגבי ההוצאות על הקצאת משאבים ועלויות אשכולות ב-GKE.

מידע נוסף על העלויות של הפעלת אשכול GKE זמין במאמר תמחור GKE.

שיקולים כשמבצעים התאמה של עומסי עבודה

לפני שמיישמים המלצה להגדלה או להקטנה של עומס עבודה, כדאי לשקול את הנקודות הבאות:

  • בודקים את ניצול המשאבים של עומס העבודה כדי לראות את הביצועים שלו, ואם הוא משתמש ביותר או פחות מעבד (CPU) וזיכרון מהצפוי. הוראות מפורטות מופיעות במאמר ניתוח בקשות למשאבים.
  • יכול להיות שעומסי עבודה (workloads) של עיבוד באצווה ישמרו בכוונה על ניצול גבוה כדי לחסוך בעלויות. אם המשאבים שהוקצו מספיקים למשימות באצ', לא צריך להגדיל את עומס העבודה עם ניצול גבוה, שזוהה כעומס עבודה עם הקצאת משאבים נמוכה מדי.
  • ל-GKE יש נראות מוגבלת לגבי השימוש בפועל בזיכרון של עומסי עבודה (workload) שמבוססים על Java Virtual Machine‏ (JVM). מומלץ לבדוק היטב לפני שמיישמים המלצות לסוגי עומסי עבודה כאלה.

יישום ההמלצה להתאמת גודל של עומס עבודה

כדי להתאים את הגודל של עומס עבודה כך שיתאים יותר לניצול המשאבים של עומס העבודה, אפשר לבצע את אחת מהפעולות הבאות:

  • מפעילים התאמה אנכית של קבוצות Pod לעומס עבור עומס העבודה. מידע נוסף זמין במאמר בנושא הגדרה אוטומטית של בקשות למשאבי Pod.
  • משנים את הבקשות והמגבלות באופן ידני בהתאם להמלצה:

    • עומס עבודה עם הקצאת משאבים נמוכה מדי: כדי ליישם את ההמלצה להתאמת גודל של עומס עבודה עם הקצאת משאבים נמוכה מדי, צריך להגדיל את בקשות המשאבים ואת המגבלות של עומס העבודה. כשמיישמים את ההמלצה הזו, אפשר לוודא שעומס העבודה יישאר אמין כי יש לו את כמות המשאבים המתאימה לאפליקציות שלו.
    • עומס עבודה עם הקצאת יתר של משאבים: כדי ליישם את ההמלצה להתאמת גודל של עומס עבודה עם הקצאת יתר של משאבים, צריך להקטין את בקשות המשאבים ואת המגבלות של עומס העבודה. כדאי לשנות את הקצאות המעבד והזיכרון של האשכול כך שיתאימו לצרכים של עומס העבודה. כשמיישמים את ההמלצה הזו, מוודאים שמשתמשים רק במשאבים שדרושים להפעלת עומס העבודה.

המאמרים הבאים