העיקרון הזה הוא חלק מעמודת האופטימיזציה של העלויות בGoogle Cloud Well-Architected Framework, והוא כולל המלצות שיעזרו לכם לתכנן ולספק משאבים בהתאם לדרישות ולדפוסי הצריכה של עומסי העבודה בענן.
סקירה כללית של העקרונות
כדי לבצע אופטימיזציה של עלות משאבי הענן, צריך להבין היטב את דרישות המשאבים של עומסי העבודה ואת דפוסי הטעינה. ההבנה הזו היא הבסיס למודל עלויות מוגדר היטב, שמאפשר לכם לחזות את עלות הבעלות הכוללת (TCO) ולזהות את הגורמים לשינוי בעלויות לאורך תהליך המעבר לענן. ניתוח וחיזוי יזומים של ההוצאות על הענן מאפשרים לכם לקבל החלטות מושכלות לגבי הקצאת משאבים, ניצול משאבים ואופטימיזציה של העלויות. הגישה הזו מאפשרת לכם לשלוט בהוצאות על הענן, להימנע מהקצאת יתר ולוודא שמשאבי הענן מותאמים לצרכים הדינמיים של עומסי העבודה והסביבות שלכם.
המלצות
כדי לבצע אופטימיזציה יעילה של השימוש במשאבי הענן, כדאי להביא בחשבון את ההמלצות הבאות.
בחירת משאבים ספציפיים לסביבה
לכל סביבת פריסה יש דרישות שונות לגבי זמינות, מהימנות ומדרגיות. לדוגמה, יכול להיות שמפתחים יעדיפו סביבה שמאפשרת להם לפרוס ולהפעיל במהירות אפליקציות לפרקי זמן קצרים, אבל לא יזדקקו לזמינות גבוהה. מצד שני, בסביבת ייצור נדרשת בדרך כלל זמינות גבוהה. כדי למקסם את השימוש במשאבים, צריך להגדיר דרישות ספציפיות לסביבה על סמך הצרכים העסקיים. בטבלה הבאה מפורטות דוגמאות לדרישות ספציפיות לסביבה.
| סביבה | דרישות |
| ייצור |
|
| פיתוח ובדיקה |
|
| סביבות אחרות (כמו סביבת פיתוח וסביבת בדיקה) |
|
בחירת משאבים ספציפיים לעומס העבודה
יכול להיות שלכל אחד מעומסי העבודה בענן יהיו דרישות שונות לגבי זמינות, מדרגיות, אבטחה וביצועים. כדי לייעל את העלויות, צריך להתאים את בחירת המשאבים לדרישות הספציפיות של כל עומס עבודה. לדוגמה, יכול להיות שאפליקציה בלי שמירת מצב לא תדרוש את אותה רמה של זמינות או אמינות כמו קצה עורפי עם שמירת מצב. בטבלה הבאה מפורטות דוגמאות נוספות לדרישות ספציפיות לעומס עבודה.
| סוג עומס העבודה | דרישות לגבי עומסי עבודה | אפשרויות משאבים |
| קריטי לפעילות העסקית | זמינות רציפה, אבטחה חזקה וביצועים גבוהים | משאבי פרימיום ושירותים מנוהלים כמו Spanner, לזמינות גבוהה ועקביות גלובלית של נתונים. |
| לא קריטיות | תשתית חסכונית וניתנת להתאמה לעומס (autoscaling) | משאבים עם תכונות בסיסיות ומשאבים זמניים כמו מכונות וירטואליות מסוג Spot. |
| מבוסס-אירועים | התאמה דינמית של קנה המידה על סמך הביקוש הנוכחי לקיבולת ולביצועים | שירותים בלי שרת (serverless) כמו Cloud Run ופונקציות Cloud Run. |
| עומסי עבודה ניסיוניים | סביבה גמישה וזולה לפיתוח מהיר, חזרה על תהליך העבודה, בדיקות וחדשנות | משאבים עם תכונות בסיסיות, משאבים זמניים כמו מכונות וירטואליות מסוג Spot וסביבות ארגז חול עם מגבלות הוצאות מוגדרות. |
אחד היתרונות של הענן הוא האפשרות לנצל את כוח המחשוב המתאים ביותר לעומס עבודה נתון. חלק מעומסי העבודה מפותחים כדי לנצל את ערכות ההוראות של המעבד, וחלק אחר לא מתוכנן בצורה כזו. כדאי להשוות בין עומסי העבודה ולנתח אותם בהתאם. סיווג עומסי העבודה ובחירת משאבים ספציפיים לעומס העבודה (לדוגמה, בחירת משפחות מכונות מתאימות למכונות וירטואליות ב-Compute Engine). השיטה הזו עוזרת לייעל את העלויות, לאפשר חדשנות ולשמור על רמת הזמינות והביצועים שנדרשת לעומסי העבודה.
הנה כמה דוגמאות לאופן שבו אפשר ליישם את ההמלצה הזו:
- לעומסי עבודה קריטיים שמשרתים משתמשים שמפוזרים ברחבי העולם, כדאי להשתמש ב-Spanner. Spanner מבטל את הצורך בפריסות מסד נתונים מורכבות, כי הוא מבטיח את המהימנות והעקביות של הנתונים בכל האזורים.
- עבור עומסי עבודה עם רמות עומס משתנות, כדאי להשתמש בהתאמת קנה מידה אוטומטית כדי שלא תצטרכו לשלם כשהעומס נמוך, ועדיין לשמור על קיבולת מספקת שתעמוד בעומס הנוכחי. אפשר להגדיר שינוי גודל אוטומטי עבור הרבהGoogle Cloud שירותים, כולל מכונות וירטואליות ב-Compute Engine, אשכולות Google Kubernetes Engine (GKE) ו-Cloud Run. כשמגדירים התאמה אוטומטית לעומס, אפשר להגדיר מגבלות על התאמה לעומס כדי לוודא שהעלויות לא יחרגו מהתקציבים שצוינו.
בחירת אזורים על סמך דרישות העלות
כדי להבין את ההבדלים בין העלויות, הקיימות, זמני האחזור וגורמים אחרים, אפשר להשתמש בGoogle Cloud Region Picker. Google Cloud
שימוש באפשרויות מובנות לאופטימיזציה של עלויות
Google Cloud products מספקים תכונות מובנות שיעזרו לכם לייעל את השימוש במשאבים ולשלוט בעלויות. בטבלה הבאה מפורטות דוגמאות לתכונות של אופטימיזציה של עלויות שבהן תוכלו להשתמש בחלק ממוצרי Google Cloud :
| Product | התכונה 'אופטימיזציה של עלויות' |
| Compute Engine |
|
| GKE |
|
| Cloud Storage |
|
| BigQuery |
|
| Google Cloud VMware Engine |
|
אופטימיזציה של שיתוף משאבים
כדי למקסם את השימוש במשאבי הענן, אפשר לפרוס כמה אפליקציות או שירותים באותה תשתית, ועדיין לעמוד בדרישות האבטחה ובדרישות אחרות של האפליקציות. לדוגמה, בסביבות פיתוח ובדיקה, אפשר להשתמש באותה תשתית ענן כדי לבדוק את כל הרכיבים של אפליקציה. בסביבת הייצור, אפשר לפרוס כל רכיב על קבוצה נפרדת של משאבים כדי להגביל את היקף ההשפעה במקרה של אירועים.
הנה כמה דוגמאות לאופן שבו אפשר ליישם את ההמלצה הזו:
- שימוש במכונה אחת של Cloud SQL לכמה סביבות שהן לא סביבות ייצור.
- אפשר להשתמש בתכונה ניהול צוותים ב-Fleet ב-GKE כדי לאפשר לכמה צוותי פיתוח לשתף אשכול GKE, עם אמצעי בקרה מתאימים לגישה.
- כדאי להשתמש ב-GKE Autopilot כדי ליהנות מטכניקות לחיסכון בעלויות כמו bin packing והתאמה אוטומטית לעומס (autoscaling), שמוטמעות ב-GKE כברירת מחדל.
- כדי לחסוך בעלויות של GPU בעומסי עבודה של AI ו-ML, אפשר להשתמש באסטרטגיות לשיתוף GPU כמו GPU מרובה-מופעים, GPU לשיתוף זמן ו-NVIDIA MPS.
פיתוח ותחזוקה של ארכיטקטורות לדוגמה
ליצור ולתחזק מאגר של ארכיטקטורות הפניה שמותאמות לדרישות של סביבות פריסה שונות ולסוגים שונים של עומסי עבודה. כדי לייעל את תהליך התכנון וההטמעה של פרויקטים ספציפיים, צוות כמו מרכז מצוינות בענן (CCoE) יכול לנהל את התוכניות באופן מרכזי. צוותי פרויקטים יכולים לבחור תוכניות מתאימות על סמך קריטריונים מוגדרים בבירור, כדי להבטיח עקביות ארכיטקטונית ואימוץ של שיטות מומלצות. אם יש דרישות ייחודיות לפרויקט, צוות הפרויקט וצוות הארכיטקטורה המרכזי צריכים לשתף פעולה כדי לתכנן ארכיטקטורות הפניה חדשות. אתם יכולים לשתף את הארכיטקטורות המומלצות עם כל הארגון כדי לעודד שיתוף ידע ולהרחיב את מאגר הפתרונות הזמינים. הגישה הזו מבטיחה עקביות, מאיצה את הפיתוח, מפשטת את קבלת ההחלטות ומקדמת ניצול יעיל של המשאבים.
קוראים את הדוגמאות לארכיטקטורות ש-Google מספקת לתרחישי שימוש ולטכנולוגיות שונות. הארכיטקטורות האלה כוללות שיטות מומלצות לבחירה, להגדרה ולפריסה של משאבים, וגם לקביעת הגודל שלהם. השימוש בארכיטקטורות ההפניה האלה מאפשר לכם להאיץ את תהליך הפיתוח ולחסוך בעלויות כבר מההתחלה.
אכיפת משמעת בהוצאות באמצעות מדיניות הארגון
כדאי להשתמש במדיניות הארגון כדי להגביל את המיקומים והמוצרים הזמינים ב- Google Cloud שחברי הצוות יכולים להשתמש בהם. המדיניות הזו עוזרת לוודא שהצוותים משתמשים בפתרונות חסכוניים ומקצים משאבים במיקומים שתואמים ליעדי האופטימיזציה של העלויות.
הערכת תקציבים ריאליים והגדרת גבולות פיננסיים
פיתוח תקציבים מפורטים לכל פרויקט, עומס עבודה וסביבת פריסה. חשוב לוודא שהתקציבים מכסים את כל ההיבטים של פעולות הענן, כולל עלויות התשתית, רישיונות התוכנה, כוח האדם והצמיחה הצפויה. כדי למנוע חריגה מהתקציב ולהבטיח התאמה ליעדים הפיננסיים שלכם, כדאי להגדיר מגבלות או ספי הוצאות ברורים לפרויקטים, לשירותים או למשאבים ספציפיים. כדאי לעקוב באופן קבוע אחרי ההוצאות בענן בהשוואה למגבלות האלה. אתם יכולים להשתמש בהתראות פרואקטיביות לגבי מכסות כדי לזהות מראש חריגות פוטנציאליות בעלויות ולנקוט פעולות מתקנות בזמן.
בנוסף להגדרת תקציבים, אפשר להשתמש במכסות ובמגבלות כדי לאכוף משמעת בהוצאות ולמנוע עליות פתאומיות לא צפויות בהוצאות. אפשר להגדיר מכסות ברמות שונות, כולל פרויקטים, שירותים ואפילו סוגים ספציפיים של משאבים, וכך לשלוט בצריכת המשאבים בצורה מפורטת.
הנה כמה דוגמאות לאופן שבו אפשר ליישם את ההמלצה הזו:
- מכסות ברמת הפרויקט: הגדרת מגבלות הוצאה או מכסות משאבים ברמת הפרויקט כדי לקבוע גבולות פיננסיים כלליים ולשלוט בצריכת המשאבים בכל השירותים בפרויקט.
- מכסות ספציפיות לשירות: אפשר להגדיר מכסות לשירותים ספציפיים Google Cloud, כמו Compute Engine או BigQuery, כדי להגביל את מספר המופעים, מעבדי ה-CPU או קיבולת האחסון שאפשר להקצות.
- מכסות ספציפיות לסוגי משאבים: אפשר להגדיר מכסות לסוגים ספציפיים של משאבים, כמו מכונות וירטואליות של Compute Engine, קטגוריות של Cloud Storage, מכונות של Cloud Run או צמתים של GKE, כדי להגביל את השימוש בהם ולמנוע חריגות לא צפויות בעלויות.
- התראות לגבי מכסות: קבלת התראות כששימוש במכסה (ברמת הפרויקט) מגיע לאחוז מסוים מהערך המקסימלי.
שימוש במכסות ובמגבלות בשילוב עם תקצוב ומעקב מאפשר ליצור גישה פרואקטיבית ורב-שכבתית לבקרת עלויות. הגישה הזו עוזרת להבטיח שההוצאות על הענן יישארו בגבולות מוגדרים ויתאימו ליעדים העסקיים שלכם. חשוב לזכור שאמצעי בקרת העלויות האלה הם לא קבועים או נוקשים. כדי לוודא שאמצעי בקרת העלויות ימשיכו להתאים לסטנדרטים הנוכחיים בתעשייה וישקפו את הצרכים העסקיים המשתנים שלכם, אתם צריכים לבדוק את אמצעי הבקרה באופן קבוע ולשנות אותם כך שיכללו טכנולוגיות חדשות ושיטות מומלצות.