במאמר הזה נסביר על הדרכים השונות, שנקראות אפשרויות צריכה, לקבל משאבי מחשוב ב-AI Hypercomputer ולהשתמש בהם. בוחרים את האפשרות שהכי מתאימה לעומס העבודה, למשך הזמן ולצרכים שלכם מבחינת עלויות.
כל אפשרות צריכה מפרטת את הפרטים הבאים:
איך ניגשים לקיבולת כדי ליצור מכונות וירטואליות או אשכולות.
מודל ההקצאה הבסיסי, שקובע את הזמינות, משך החיים והתמחור של המכונות הווירטואליות.
השוואה בין אפשרויות הצריכה
בטבלה הבאה מפורטים ההבדלים העיקריים בין אפשרויות הצריכה:
| אפשרות צריכה | הזמנות עתידיות ב-AI Hypercomputer | הזמנות עתידיות ל-90 יום (במצב יומן) | Flex-start | כרטיס Spot |
|---|---|---|---|---|
| מכונות נתמכות | A4X Max, A4X, A4, A3 Ultra, A3 Mega או A3 High | A4, A3 Ultra, A3 Mega או A3 High עם 8 מעבדי GPU | כל מכונת GPU חוץ מ-A4X Max ו-A4X | כל מכונת GPU למעט A4X Max ו-A4X |
| תוחלת חיים | ללא הגבלה | עד 90 ימים | עד 7 ימים | ללא הגבלה (אבל בכפוף להפקעה) |
| יכולת הפסקה לפני הזמן | ||||
| הבטחת קיבולת | גבוהה מאוד. אם Google Cloud מאשר את בקשת השריון, הסיכוי ש-Compute Engine יקצה את הקיבולת שביקשתם הוא גבוה מאוד. | גבוהה מאוד. אם Google Cloud מאשר את בקשת השריון, הסיכוי ש-Compute Engine יקצה את הקיבולת שביקשתם הוא גבוה מאוד. | ללא התחייבות. Compute Engine מנסה כמיטב יכולתו לתזמן את הקצאת הקיבולת שביקשתם. | ללא התחייבות. Compute Engine מנסה כמיטב יכולתו להקצות את הקיבולת שביקשתם. |
| מכסה | Google Cloud מגדיל אוטומטית את המכסה לפני שהקיבולת מסופקת. | לא נצרכת מכסה. | השימוש ב-API צורך מכסה שניתנת להפסקה. | השימוש ב-API צורך מכסה שניתנת להפסקה. |
| תמחור |
|
|
|
|
| הקצאת משאבים | צפוף | צפוף | צפופה על בסיס מאמץ מרבי ( מדיניות קומפקטית או מדיניות עומסי עבודה אופציונלית) | רגיל (מדיניות קומפקטית אופציונלית) |
| מודל הקצאת ההרשאות | הזמנה בלבד | הזמנה בלבד | Flex-start | כרטיס Spot |
| שיטת יצירה |
כדי ליצור מכונות וירטואליות, צריך לבצע את הפעולות הבאות:
|
כדי ליצור מכונות וירטואליות, צריך לבצע את הפעולות הבאות:
|
כשמבקשים ליצור מכונות וירטואליות עם הפעלה גמישה, מערכת Compute Engine מתזמנת את יצירת המכונות הווירטואליות בהתאם לזמינות. כשקיבולת הופכת לזמינה, Compute Engine מקצה את המכונות הווירטואליות עם הפעלה גמישה. כדי ליצור מכונות וירטואליות מסוג Flex-start, משתמשים באחת מהשיטות שמתוארות בסקירה הכללית של אפשרויות הפריסה. |
אתם יכולים ליצור מכונות וירטואליות באופן מיידי באמצעות אחת מהשיטות שמתוארות בסקירה הכללית של אפשרויות הפריסה. |
בחירת אפשרות צריכה
היעזרו בתרשים הזרימה הבא כדי לבחור את אפשרות הצריכה שהכי מתאימה לעומס העבודה שלכם:

השאלות בתרשים שלמעלה הן:
צריכים קיבולת ליותר מ-90 ימים?
לא: עוברים לשאלה 2.
רוצים להזמין קיבולת?
כן: אפשר לעיין במאמר איך משתמשים במקומות שמורים לעתיד במצב יומן.
לא: עוברים לשאלה 3.
האם עומס העבודה שלכם סובל תקלות?
לא: אפשר לעיין במאמר בנושא שימוש ב-Flex-start.
כן: אפשר לעיין במאמר בנושא שימוש ב-Spot.
שימוש בשריון מקום שמור לעתיד ב-AI Hypercomputer
כדי להריץ עומסי עבודה ממושכים ומבוזרים בקנה מידה גדול שדורשים הקצאה צפופה של משאבים, אתם יכולים לבקש משאבי מחשוב לזמן ספציפי בעתיד. יש לכם גישה בלעדית למשאבים שהזמנתם למשך התקופה הזו, ואתם יכולים להשתמש במשאבים כדי ליצור מכונות וירטואליות או אשכולות. בסיום תקופת שמירת המקום, מערכת Compute Engine מבצעת את הפעולות הבאות:
- המקום השמור יימחק ב-Compute Engine.
- בהתאם לפעולת הסיום שציינתם למכונות הווירטואליות, מערכת Compute Engine מפסיקה או מוחקת את כל המכונות הווירטואליות שמשתמשות בהזמנה.
עומסי עבודה אידיאליים להזמנות עתידיות ב-AI Hypercomputer
הזמנות עתידיות מתאימות לעומסי העבודה הבאים:
אימון מראש של מודלים בסיסיים
היסק של מודל בסיס במארחים מרובים
מאפיינים מרכזיים של הזמנות עתידיות ב-AI Hypercomputer
המאפיינים של הזמנות עתידיות:
-
אפשר להזמין מראש סוגי מכונות A4X Max, A4X, A4, A3 Ultra, A3 Mega או A3 High (8 GPUs). המכונות מוקצות בצפיפות כדי לצמצם את זמן האחזור ברשת.
-
אתם יכולים להזמין כל מספר של מכונות וירטואליות לכל משך זמן, החל מתאריך עתידי. להשתמש במשאבים שהוזמנו כדי ליצור מכונות וירטואליות ולהפעיל אותן עד סוף תקופת ההזמנה. אם שומרים משאבים לשנה אחת או יותר, צריך לרכוש ולצרף התחייבות מבוססת-משאבים.
-
אחרי שתקופת שמירת המקום מתחילה, אפשר לשנות את הבקשות שנוצרו אוטומטית באופן הבא:
-
אתם משתמשים במודל הקצאת משאבים שקשור להזמנה, שיש לו את היתרונות הבאים:
יש לכם סיכוי גבוה יותר לקבל מעבדי GPU.
בנוסף להתחייבות שמשויכת למכונות הווירטואליות, תקבלו הנחה של עד 53% על השימוש ב-vCPU וב-GPU.
איך משתמשים בהזמנות עתידיות ב-AI Hypercomputer
כדי להשתמש בהזמנות עתידיות ליצירת מכונות וירטואליות או אשכולות, צריך לבצע את השלבים הבאים:
-
שליחת בקשה לשריין קיבולת. פונים לצוות ניהול החשבון ומציינים את המשאבים שרוצים לשריין. בהתאם לזמינות, Google יוצרת בשבילכם טיוטה של בקשה למקום שמור. אם הכל נראה בסדר, אפשר לשלוח את הבקשה. Google Cloud מאשר מיד את בקשת המקום השמור.
הוראות מפורטות מופיעות במאמר בנושא הזמנת קיבולת.
-
שימוש במשאבים שמורים. בתחילת תקופת ההזמנה שבחרתם, תוכלו להשתמש בהזמנה כדי ליצור מכונות וירטואליות או אשכולות.
במאמר סקירה כללית של אפשרויות הפריסה מוסבר על השיטות השונות ליצירת מכונות וירטואליות או אשכולות.
שימוש בהזמנות עתידיות במצב יומן
כדי להריץ עומסי עבודה מבוזרים לזמן קצר שדורשים הקצאה צפופה של משאבים, אפשר לבקש משאבי מחשוב לתקופה של עד 90 ימים. במהלך התקופה הזו יש לכם גישה בלעדית למשאבים שהזמנתם, ואתם יכולים להשתמש בהם כדי ליצור מכונות וירטואליות או אשכולות. בסיום תקופת שמירת המקום, מערכת Compute Engine מבצעת את הפעולות הבאות:
- המקום השמור יימחק ב-Compute Engine.
- בהתאם לפעולת הסיום שציינתם למכונות הווירטואליות, מערכת Compute Engine מפסיקה או מוחקת את כל המכונות הווירטואליות שמשתמשות בהזמנה.
עומסי עבודה אידיאליים להזמנות עתידיות במצב יומן
הזמנות עתידיות במצב יומן מתאימות במיוחד לעומסי העבודה הבאים:
אימון מראש של המודל
כוונון עדין של מודלים
סימולציות
הסקת מסקנות
מאפיינים עיקריים של הזמנות עתידיות במצב יומן
המאפיינים של הזמנות עתידיות במצב יומן:
-
אפשר להזמין מראש מכונות מסוג A4, A3 Ultra, A3 Mega או A3 High (עם 8 יחידות GPU). המכונות האלה מוקצות בצפיפות כדי לצמצם את זמן האחזור ברשת.
-
אתם יכולים לראות את הזמינות העתידית ולהזמין עד 80 מכונות וירטואליות למשך עד 90 יום. לאחר מכן, תוכלו להשתמש במשאבים שהוזמנו כדי ליצור מכונות וירטואליות עד לסוף תקופת ההזמנה.
-
אחרי שתקופת שמירת המקום מתחילה, אפשר לשנות את הבקשות שנוצרו אוטומטית באופן הבא:
-
אתם משתמשים במודל הקצאת משאבים שקשור להזמנה, שיש לו את היתרונות הבאים:
יש לכם סיכוי גבוה יותר לקבל מעבדי GPU.
מקבלים הנחה של עד 53% על vCPU ו-GPU.
איך משתמשים בהזמנות עתידיות במצב יומן
כדי להשתמש בהזמנות עתידיות במצב יומן כדי ליצור מכונות וירטואליות או אשכולות, צריך לבצע את השלבים הבאים:
-
צפייה בזמינות של משאבים. אתם יכולים לראות את הזמינות העתידית של המשאבים שאתם רוצים לשריין. כשיוצרים בקשה להזמנת משאבים, אפשר לציין את המספר, הסוג ומשך ההזמנה של המשאבים שאושרו כפנויים. הפעולה הזו מגדילה את הסיכוי ש Google Cloud יאשר את הבקשה.
הוראות מפורטות זמינות במאמר בנושא איך רואים את הזמינות העתידית של משאבים.
-
שמירת קיבולת. אתם יוצרים בקשה למקום שמור לתאריך ולשעה עתידיים. Google Cloud מאשרת את הבקשה תוך שתי דקות. אם הבקשה תאושר, קיבולת תישמר ב-Compute Engine. בתאריך המסירה שבחרתם, תוכלו להשתמש במשאבים שהוזמנו כדי ליצור מכונות וירטואליות או אשכולות.
הוראות מפורטות מופיעות במאמר בנושא יצירת בקשה לשמירת מקום למכונות וירטואליות עם GPU או TPU.
-
שימוש במשאבים שמורים. בתחילת תקופת ההזמנה שבחרתם, תוכלו להשתמש בהזמנה כדי ליצור מכונות וירטואליות או אשכולות.
למידע על השיטות השונות ליצירת מכונות וירטואליות או אשכולות, אפשר לעיין במקורות הבאים:
- כדי ליצור מכונות וירטואליות מסוג A4, A3 Ultra, A3 Mega או A3 High (עם 8 יחידות GPU), אפשר לעיין במאמר בנושא אפשרויות פריסה.
- כדי ליצור מכונות וירטואליות (VM) מסוג A3 Mega או A3 High (עם 8 יחידות GPU) עם GPUDirect-TCPX מופעל, אפשר לעיין במאמר בנושא יצירת מכונת A3 וירטואלית עם GPUDirect-TCPX מופעל.
שימוש ב-Flex-start
כדי להריץ עומסי עבודה לפרק זמן קצר שדורשים הקצאה צפופה של משאבים, אפשר לבקש משאבי מחשוב למשך עד שבעה ימים באמצעות Flex-start. בכל פעם שמשאבים זמינים, Compute Engine יוצרת את מספר המכונות הווירטואליות שביקשתם. אפשר להפסיק מכונות וירטואליות עצמאיות עם הפעלה גמישה, אבל אי אפשר להפסיק מכונות וירטואליות עם הפעלה גמישה שנוצרו על ידי קבוצת מופעים מנוהלת (MIG) באמצעות בקשות לשינוי גודל. מכונות ה-VM עם הפעלה גמישה קיימות עד שמוחקים אותן, או עד ש-Compute Engine מוחק אותן בסוף משך ההפעלה שלהן.
עומסי עבודה אידיאליים ל-Flex-start
התחלה גמישה מתאימה לעומסי עבודה שאפשר להתחיל בכל שלב, כמו:
אימון מקדים של מודל קטן
כוונון עדין של מודלים
סימולציות
היסק באצווה
מאפיינים מרכזיים של Flex-start
ל-Flex-start יש את המאפיינים הבאים:
-
אפשר לבקש כל סוג מכונה של GPU, חוץ מ-A4X Max ומ-A4X. Compute Engine עושה מאמצים רבים להקצאת מכונות בצפיפות, ולכן יכול להיות שמכונות וירטואליות עם הפעלה גמישה יהיו מרוחקות זו מזו באותו תחום. כדי לשלוט במיקום של מכונות ה-VM ולצמצם את זמן האחזור ברשת, אפשר:
- למכונות וירטואליות עצמאיות מסוג Flex-start, צריך להחיל מדיניות למיקום קומפקטי על המכונות הווירטואליות.
- כדי להחיל מדיניות עומס עבודה על קבוצות של מכונות וירטואליות עם גודל יעד,
אתם משתמשים במודל הקצאת ההרשאות עם התחלה גמישה, שיש לו את היתרונות הבאים:
יש לכם סיכוי גבוה יותר לקבל מעבדי GPU.
מקבלים הנחה של עד 53% על vCPU, זיכרון ו-GPU.
איך משתמשים בשיטת התחלה גמישה
כדי להשתמש ב-Flex-start כדי ליצור מכונות וירטואליות או אשכולות, צריך לבצע את השלבים הבאים:
-
אופציונלי: יוצרים מדיניות למיקום קומפקטי או מדיניות לעומס עבודה. אתם יכולים ליצור מדיניות מיקום קומפקטית (למכונות וירטואליות עצמאיות או למכונות וירטואליות בכמות גדולה) או מדיניות עומס עבודה (ל-MIG) כדי לציין את הקרבה של המכונות הווירטואליות. ההגדרה שבחרתם משפיעה על סוגי המכונות ועל מספר המכונות הווירטואליות שהמדיניות תומכת בהן.
-
יצירת מכונות וירטואליות עם הפעלה גמישה אחרי שמבקשים ליצור מכונות וירטואליות, Compute Engine מתזמן את יצירת המכונות הווירטואליות בהתאם לזמינות. כשקיבולת הופכת לזמינה, מערכת Compute Engine מקצה את המכונות הווירטואליות עם הפעלה גמישה. מכונות וירטואליות פועלות עד שמפסיקים או מוחקים אותן, או עד שהן מגיעות לסוף משך ההפעלה שלהן.
הוראות מפורטות מופיעות במאמר סקירה כללית על אפשרויות הפריסה.
שימוש ב-Spot
כדי להריץ עומסי עבודה עמידים בכשלים, אתם יכולים לקבל משאבי מחשוב באופן מיידי על סמך הזמינות. אתם מקבלים משאבים במחיר הנמוך ביותר האפשרי. עם זאת, Compute Engine יכול להפסיק את הפעולה של מכונות וירטואליות בכל שלב כדי לפנות קיבולת.
עומסי עבודה אידיאליים ל-Spot
Spot מתאים לעומסי עבודה שבהם הפרעות הן דבר מקובל, כמו:
עיבוד באצווה
מחשוב עתיר ביצועים (HPC)
אינטגרציה רציפה (CI) ופריסה רציפה (CD)
ניתוח נתונים
קידוד מדיה
היקש אונליין
מאפיינים מרכזיים של Spot
ל-Spot יש את המאפיינים הבאים:
-
אפשר ליצור כל סוג מכונת GPU, חוץ מ-A4X Max ומ-A4X. הקצאה צפופה תלויה בזמינות המשאבים. כדי להגדיל את הסיכוי להקצאה קרובה, אפשר להחיל על המכונות הווירטואליות מדיניות מיקום קומפקטית.
-
אתם יכולים ליצור מכונות וירטואליות באופן מיידי. מכונות ה-VM פועלות עד שמפסיקים את הפעילות שלהן או מוחקים אותן, או עד ש-Compute Engine מבצע הקצאה מראש של מכונות ה-VM כדי לפנות קיבולת.
-
אתם משתמשים במודל הקצאת המשאבים לפי דרישה, שיש לו את היתרונות הבאים:
יש לכם סיכוי גבוה יותר לקבל מעבדי GPU.
אתם מקבלים הנחה של עד 91% על סוגים רבים של מכונות, יחידות GPU, יחידות TPU ודיסקים מקומיים של SSD.
איך משתמשים ב-Spot
כדי להשתמש ב-Spot ליצירת מכונות וירטואליות או אשכולות, צריך לבצע את השלבים הבאים:
-
איך בודקים את הזמינות של משאבים אפשר לראות את הזמינות של המשאבים באזור או בתחום שבו רוצים ליצור מכונות וירטואליות מסוג Spot. הפעולה הזו עוזרת לצמצם את הסיכויים להיתקל בשגיאות שקשורות לזמינות משאבים.
הוראות מפורטות זמינות במאמר בנושא צפייה בזמינות של מכונות וירטואליות מסוג Spot.
-
אופציונלי: צפייה בשיעור ההקצאה מראש ובמחירים. אפשר לראות את שיעור ההפקעה ההיסטורי והנוכחי ואת התמחור של סוגים שונים של מכונות ואזורים. המידע הזה עוזר לכם לבחור את סוג המכונה והמיקום שהכי מתאימים לעומס העבודה ולתקציב שלכם.
הוראות מפורטות במאמר בנושא צפייה בשיעור ההפקעה ובמחירים של מכונות Spot.
-
אופציונלי: יוצרים מדיניות למיקום קומפקטי או מדיניות לעומס עבודה. אתם יכולים ליצור מדיניות מיקום קומפקטית (למכונות וירטואליות עצמאיות או למכונות וירטואליות בכמות גדולה) או מדיניות עומס עבודה (ל-MIG) כדי לציין את הקרבה של המכונות הווירטואליות. ההגדרה שבחרתם משפיעה על סוגי המכונות ועל מספר המכונות הווירטואליות שהמדיניות תומכת בהן.
הוראות מפורטות זמינות במאמרים בנושא הפחתת זמן האחזור באמצעות מדיניות מיקום קומפקטית ויצירת מדיניות עומסי עבודה עבור קבוצות של מכונות מנוהלות (MIG).
-
איך יוצרים מכונות וירטואליות במודל Spot אפשר ליצור כמה מכונות וירטואליות שרוצים, בהתאם לזמינות. מכונות ה-VM פועלות עד שמפסיקים את הפעילות שלהן או מוחקים אותן, או עד שמערכת Compute Engine מפסיקה את הפעילות שלהן כדי לפנות קיבולת.
הוראות מפורטות מופיעות במאמר סקירה כללית של אפשרויות הפריסה.