Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

בחירת אפשרות צריכה

במאמר הזה נסביר על הדרכים השונות, שנקראות אפשרויות צריכה, לקבל משאבי מחשוב ב-AI Hypercomputer ולהשתמש בהם. בוחרים את האפשרות שהכי מתאימה לעומס העבודה, למשך הזמן ולצרכים שלכם מבחינת עלויות.

כל אפשרות צריכה מפרטת את הפרטים הבאים:

איך ניגשים לקיבולת כדי ליצור מכונות וירטואליות או אשכולות.
מודל ההקצאה הבסיסי, שקובע את הזמינות, משך החיים והתמחור של המכונות הווירטואליות.

השוואה בין אפשרויות הצריכה

בטבלה הבאה מפורטים ההבדלים העיקריים בין אפשרויות הצריכה:

אפשרות צריכה	הזמנות עתידיות ב-AI Hypercomputer	הזמנות עתידיות ל-90 יום (במצב יומן)	Flex-start	כרטיס Spot
מכונות נתמכות	‫A4X Max,‏ A4X,‏ A4,‏ A3 Ultra,‏ A3 Mega או A3 High	‫A4,‏ A3 Ultra,‏ A3 Mega או A3 High עם 8 מעבדי GPU	כל מכונת GPU חוץ מ-A4X Max ו-A4X	כל מכונת GPU למעט A4X Max ו-A4X
תוחלת חיים	ללא הגבלה	עד 90 ימים	עד 7 ימים	ללא הגבלה (אבל בכפוף להפקעה)
יכולת הפסקה לפני הזמן
הבטחת קיבולת	גבוהה מאוד. אם Google Cloud מאשר את בקשת השריון, הסיכוי ש-Compute Engine יקצה את הקיבולת שביקשתם הוא גבוה מאוד.	גבוהה מאוד. אם Google Cloud מאשר את בקשת השריון, הסיכוי ש-Compute Engine יקצה את הקיבולת שביקשתם הוא גבוה מאוד.	ללא התחייבות. ‫Compute Engine מנסה כמיטב יכולתו לתזמן את הקצאת הקיבולת שביקשתם.	ללא התחייבות. ‫Compute Engine מנסה כמיטב יכולתו להקצות את הקיבולת שביקשתם.
מכסה	Google Cloud מגדיל אוטומטית את המכסה לפני שהקיבולת מסופקת.	לא נצרכת מכסה.	השימוש ב-API צורך מכסה שניתנת להפסקה.	השימוש ב-API צורך מכסה שניתנת להפסקה.
תמחור	הנחה (עד 53%). במאמר תמחור של מכונות VM שעברו אופטימיזציה למאיצים מפורטים המחירים. אם מזמינים משאבים לשנה או יותר, צריך לרכוש ולצרף התחייבות מבוססת-משאבים למשאבים המוזמנים. החיוב הוא על תקופת ההזמנה. חיוב על הזמנות	הנחה (עד 53%). ראו תמחור של Dynamic Workload Scheduler. החיוב הוא על תקופת ההזמנה.	הנחה (עד 53%). ראו תמחור של Dynamic Workload Scheduler. אתם משלמים לפי שימוש (PAYG).	הנחה משמעותית (עד 91%). תמחור של מכונות VM זמניות במודל Spot ותמחור של מכונות VM שעברו אופטימיזציה לשימוש במאיצים. אתם משלמים לפי שימוש (PAYG).
הקצאת משאבים	צפוף	צפוף	צפופה על בסיס מאמץ מרבי ( מדיניות קומפקטית או מדיניות עומסי עבודה אופציונלית)	רגיל (מדיניות קומפקטית אופציונלית)
מודל הקצאת ההרשאות	הזמנה בלבד	הזמנה בלבד	Flex-start	כרטיס Spot
שיטת יצירה	כדי ליצור מכונות וירטואליות, צריך לבצע את הפעולות הבאות: כדי לשריין קיבולת, צריך לפנות לצוות ניהול החשבון. בתאריך ובשעה שתבחרו, תוכלו להשתמש בקיבולת השמורה כדי ליצור מכונות וירטואליות ואשכולות באמצעות אחת מהשיטות שמתוארות בסקירה הכללית של אפשרויות הפריסה.	כדי ליצור מכונות וירטואליות, צריך לבצע את הפעולות הבאות: איך יוצרים מקום שמור לעתיד במצב יומן בתאריך ובשעה שבחרתם, תוכלו להשתמש בקיבולת השמורה כדי ליצור מכונות וירטואליות ואשכולות באמצעות אחת מהשיטות שמתוארות במאמר סקירה כללית של אפשרויות הפריסה.	כשמבקשים ליצור מכונות וירטואליות עם הפעלה גמישה, מערכת Compute Engine מתזמנת את יצירת המכונות הווירטואליות בהתאם לזמינות. כשקיבולת הופכת לזמינה,‏ Compute Engine מקצה את המכונות הווירטואליות עם הפעלה גמישה. כדי ליצור מכונות וירטואליות מסוג Flex-start, משתמשים באחת מהשיטות שמתוארות בסקירה הכללית של אפשרויות הפריסה.	אתם יכולים ליצור מכונות וירטואליות באופן מיידי באמצעות אחת מהשיטות שמתוארות בסקירה הכללית של אפשרויות הפריסה.

בחירת אפשרות צריכה

היעזרו בתרשים הזרימה הבא כדי לבחור את אפשרות הצריכה שהכי מתאימה לעומס העבודה שלכם:

תרשים זרימה עם אפשרויות הצריכה של AI Hypercomputer.

השאלות בתרשים שלמעלה הן:

צריכים קיבולת ליותר מ-90 ימים?
- כן: ראו שימוש בשמירת מקום לעתיד ב-AI Hypercomputer.
- לא: עוברים לשאלה 2.
רוצים להזמין קיבולת?
- כן: אפשר לעיין במאמר איך משתמשים במקומות שמורים לעתיד במצב יומן.
- לא: עוברים לשאלה 3.
האם עומס העבודה שלכם סובל תקלות?
- לא: אפשר לעיין במאמר בנושא שימוש ב-Flex-start.
- כן: אפשר לעיין במאמר בנושא שימוש ב-Spot.

שימוש בשריון מקום שמור לעתיד ב-AI Hypercomputer

כדי להריץ עומסי עבודה ממושכים ומבוזרים בקנה מידה גדול שדורשים הקצאה צפופה של משאבים, אתם יכולים לבקש משאבי מחשוב לזמן ספציפי בעתיד. יש לכם גישה בלעדית למשאבים שהזמנתם למשך התקופה הזו, ואתם יכולים להשתמש במשאבים כדי ליצור מכונות וירטואליות או אשכולות. בסיום תקופת שמירת המקום, מערכת Compute Engine מבצעת את הפעולות הבאות:

המקום השמור יימחק ב-Compute Engine.
בהתאם לפעולת הסיום שציינתם למכונות הווירטואליות, מערכת Compute Engine מפסיקה או מוחקת את כל המכונות הווירטואליות שמשתמשות בהזמנה.

עומסי עבודה אידיאליים להזמנות עתידיות ב-AI Hypercomputer

הזמנות עתידיות מתאימות לעומסי העבודה הבאים:

אימון מראש של מודלים בסיסיים
היסק של מודל בסיס במארחים מרובים

מאפיינים מרכזיים של הזמנות עתידיות ב-AI Hypercomputer

המאפיינים של הזמנות עתידיות:

אפשר להזמין מראש סוגי מכונות A4X Max,‏ A4X,‏ A4,‏ A3 Ultra,‏ A3 Mega או A3 High (8 GPUs). המכונות מוקצות בצפיפות כדי לצמצם את זמן האחזור ברשת.
אתם יכולים להזמין כל מספר של מכונות וירטואליות לכל משך זמן, החל מתאריך עתידי. להשתמש במשאבים שהוזמנו כדי ליצור מכונות וירטואליות ולהפעיל אותן עד סוף תקופת ההזמנה. אם שומרים משאבים לשנה אחת או יותר, צריך לרכוש ולצרף התחייבות מבוססת-משאבים.
אחרי שתקופת שמירת המקום מתחילה, אפשר לשנות את הבקשות שנוצרו אוטומטית באופן הבא:
- הפעלה או השבתה של התראות על תחזוקת חירום של חומרה
- הפעלה או השבתה של השימוש במשימות של Vertex AI
אתם משתמשים במודל הקצאת משאבים שקשור להזמנה, שיש לו את היתרונות הבאים:
- יש לכם סיכוי גבוה יותר לקבל מעבדי GPU.
- בנוסף להתחייבות שמשויכת למכונות הווירטואליות, תקבלו הנחה של עד 53% על השימוש ב-vCPU וב-GPU.

איך משתמשים בהזמנות עתידיות ב-AI Hypercomputer

כדי להשתמש בהזמנות עתידיות ליצירת מכונות וירטואליות או אשכולות, צריך לבצע את השלבים הבאים:

שליחת בקשה לשריין קיבולת. פונים לצוות ניהול החשבון ומציינים את המשאבים שרוצים לשריין. בהתאם לזמינות, Google יוצרת בשבילכם טיוטה של בקשה למקום שמור. אם הכל נראה בסדר, אפשר לשלוח את הבקשה. Google Cloud מאשר מיד את בקשת המקום השמור.

הוראות מפורטות מופיעות במאמר בנושא הזמנת קיבולת.
שימוש במשאבים שמורים. בתחילת תקופת ההזמנה שבחרתם, תוכלו להשתמש בהזמנה כדי ליצור מכונות וירטואליות או אשכולות.

במאמר סקירה כללית של אפשרויות הפריסה מוסבר על השיטות השונות ליצירת מכונות וירטואליות או אשכולות.

שימוש בהזמנות עתידיות במצב יומן

כדי להריץ עומסי עבודה מבוזרים לזמן קצר שדורשים הקצאה צפופה של משאבים, אפשר לבקש משאבי מחשוב לתקופה של עד 90 ימים. במהלך התקופה הזו יש לכם גישה בלעדית למשאבים שהזמנתם, ואתם יכולים להשתמש בהם כדי ליצור מכונות וירטואליות או אשכולות. בסיום תקופת שמירת המקום, מערכת Compute Engine מבצעת את הפעולות הבאות:

המקום השמור יימחק ב-Compute Engine.
בהתאם לפעולת הסיום שציינתם למכונות הווירטואליות, מערכת Compute Engine מפסיקה או מוחקת את כל המכונות הווירטואליות שמשתמשות בהזמנה.

עומסי עבודה אידיאליים להזמנות עתידיות במצב יומן

הזמנות עתידיות במצב יומן מתאימות במיוחד לעומסי העבודה הבאים:

אימון מראש של המודל
כוונון עדין של מודלים
סימולציות
הסקת מסקנות

מאפיינים עיקריים של הזמנות עתידיות במצב יומן

המאפיינים של הזמנות עתידיות במצב יומן:

אפשר להזמין מראש מכונות מסוג A4,‏ A3 Ultra,‏ A3 Mega או A3 High (עם 8 יחידות GPU). המכונות האלה מוקצות בצפיפות כדי לצמצם את זמן האחזור ברשת.
אתם יכולים לראות את הזמינות העתידית ולהזמין עד 80 מכונות וירטואליות למשך עד 90 יום. לאחר מכן, תוכלו להשתמש במשאבים שהוזמנו כדי ליצור מכונות וירטואליות עד לסוף תקופת ההזמנה.
אחרי שתקופת שמירת המקום מתחילה, אפשר לשנות את הבקשות שנוצרו אוטומטית באופן הבא:
- הפעלה או השבתה של התראות על תחזוקת חירום של חומרה
- הפעלה או השבתה של השימוש במשימות של Vertex AI
אתם משתמשים במודל הקצאת משאבים שקשור להזמנה, שיש לו את היתרונות הבאים:
- יש לכם סיכוי גבוה יותר לקבל מעבדי GPU.
- מקבלים הנחה של עד 53% על vCPU ו-GPU.

איך משתמשים בהזמנות עתידיות במצב יומן

כדי להשתמש בהזמנות עתידיות במצב יומן כדי ליצור מכונות וירטואליות או אשכולות, צריך לבצע את השלבים הבאים:

צפייה בזמינות של משאבים. אתם יכולים לראות את הזמינות העתידית של המשאבים שאתם רוצים לשריין. כשיוצרים בקשה להזמנת משאבים, אפשר לציין את המספר, הסוג ומשך ההזמנה של המשאבים שאושרו כפנויים. הפעולה הזו מגדילה את הסיכוי ש Google Cloud יאשר את הבקשה.

הוראות מפורטות זמינות במאמר בנושא  איך רואים את הזמינות העתידית של משאבים.
שמירת קיבולת. אתם יוצרים בקשה למקום שמור לתאריך ולשעה עתידיים. Google Cloud מאשרת את הבקשה תוך שתי דקות. אם הבקשה תאושר, קיבולת תישמר ב-Compute Engine. בתאריך המסירה שבחרתם, תוכלו להשתמש במשאבים שהוזמנו כדי ליצור מכונות וירטואליות או אשכולות.

הוראות מפורטות מופיעות במאמר בנושא יצירת בקשה לשמירת מקום למכונות וירטואליות עם GPU או TPU.
שימוש במשאבים שמורים. בתחילת תקופת ההזמנה שבחרתם, תוכלו להשתמש בהזמנה כדי ליצור מכונות וירטואליות או אשכולות.

למידע על השיטות השונות ליצירת מכונות וירטואליות או אשכולות, אפשר לעיין במקורות הבאים:
- כדי ליצור מכונות וירטואליות מסוג A4,‏ A3 Ultra,‏ A3 Mega או A3 High (עם 8 יחידות GPU), אפשר לעיין במאמר בנושא אפשרויות פריסה.
- כדי ליצור מכונות וירטואליות (VM) מסוג A3 Mega או A3 High (עם 8 יחידות GPU) עם GPUDirect-TCPX מופעל, אפשר לעיין במאמר בנושא יצירת מכונת A3 וירטואלית עם GPUDirect-TCPX מופעל.

שימוש ב-Flex-start

כדי להריץ עומסי עבודה לפרק זמן קצר שדורשים הקצאה צפופה של משאבים, אפשר לבקש משאבי מחשוב למשך עד שבעה ימים באמצעות Flex-start. בכל פעם שמשאבים זמינים,‏ Compute Engine יוצרת את מספר המכונות הווירטואליות שביקשתם. אפשר להפסיק מכונות וירטואליות עצמאיות עם הפעלה גמישה, אבל אי אפשר להפסיק מכונות וירטואליות עם הפעלה גמישה שנוצרו על ידי קבוצת מופעים מנוהלת (MIG) באמצעות בקשות לשינוי גודל. מכונות ה-VM עם הפעלה גמישה קיימות עד שמוחקים אותן, או עד ש-Compute Engine מוחק אותן בסוף משך ההפעלה שלהן.

עומסי עבודה אידיאליים ל-Flex-start

התחלה גמישה מתאימה לעומסי עבודה שאפשר להתחיל בכל שלב, כמו:

אימון מקדים של מודל קטן
כוונון עדין של מודלים
סימולציות
היסק באצווה

מאפיינים מרכזיים של Flex-start

ל-Flex-start יש את המאפיינים הבאים:

אפשר לבקש כל סוג מכונה של GPU, חוץ מ-A4X Max ומ-A4X. ‫Compute Engine עושה מאמצים רבים להקצאת מכונות בצפיפות, ולכן יכול להיות שמכונות וירטואליות עם הפעלה גמישה יהיו מרוחקות זו מזו באותו תחום. כדי לשלוט במיקום של מכונות ה-VM ולצמצם את זמן האחזור ברשת, אפשר:
- למכונות וירטואליות עצמאיות מסוג Flex-start, צריך להחיל מדיניות למיקום קומפקטי על המכונות הווירטואליות.
- כדי להחיל מדיניות עומס עבודה על קבוצות של מכונות וירטואליות עם גודל יעד,
אתם משתמשים במודל הקצאת ההרשאות עם התחלה גמישה, שיש לו את היתרונות הבאים:
- יש לכם סיכוי גבוה יותר לקבל מעבדי GPU.
- מקבלים הנחה של עד 53% על vCPU, זיכרון ו-GPU.

איך משתמשים בשיטת התחלה גמישה

כדי להשתמש ב-Flex-start כדי ליצור מכונות וירטואליות או אשכולות, צריך לבצע את השלבים הבאים:

אופציונלי: יוצרים מדיניות למיקום קומפקטי או מדיניות לעומס עבודה. אתם יכולים ליצור מדיניות מיקום קומפקטית (למכונות וירטואליות עצמאיות או למכונות וירטואליות בכמות גדולה) או מדיניות עומס עבודה (ל-MIG) כדי לציין את הקרבה של המכונות הווירטואליות. ההגדרה שבחרתם משפיעה על סוגי המכונות ועל מספר המכונות הווירטואליות שהמדיניות תומכת בהן.
יצירת מכונות וירטואליות עם הפעלה גמישה אחרי שמבקשים ליצור מכונות וירטואליות,‏ Compute Engine מתזמן את יצירת המכונות הווירטואליות בהתאם לזמינות. כשקיבולת הופכת לזמינה, מערכת Compute Engine מקצה את המכונות הווירטואליות עם הפעלה גמישה. מכונות וירטואליות פועלות עד שמפסיקים או מוחקים אותן, או עד שהן מגיעות לסוף משך ההפעלה שלהן.

הוראות מפורטות מופיעות במאמר סקירה כללית על אפשרויות הפריסה.

שימוש ב-Spot

כדי להריץ עומסי עבודה עמידים בכשלים, אתם יכולים לקבל משאבי מחשוב באופן מיידי על סמך הזמינות. אתם מקבלים משאבים במחיר הנמוך ביותר האפשרי. עם זאת, Compute Engine יכול להפסיק את הפעולה של מכונות וירטואליות בכל שלב כדי לפנות קיבולת.

עומסי עבודה אידיאליים ל-Spot

‫Spot מתאים לעומסי עבודה שבהם הפרעות הן דבר מקובל, כמו:

עיבוד באצווה
מחשוב עתיר ביצועים (HPC)
אינטגרציה רציפה (CI) ופריסה רציפה (CD)
ניתוח נתונים
קידוד מדיה
היקש אונליין

מאפיינים מרכזיים של Spot

ל-Spot יש את המאפיינים הבאים:

אפשר ליצור כל סוג מכונת GPU, חוץ מ-A4X Max ומ-A4X. הקצאה צפופה תלויה בזמינות המשאבים. כדי להגדיל את הסיכוי להקצאה קרובה, אפשר להחיל על המכונות הווירטואליות מדיניות מיקום קומפקטית.
אתם יכולים ליצור מכונות וירטואליות באופן מיידי. מכונות ה-VM פועלות עד שמפסיקים את הפעילות שלהן או מוחקים אותן, או עד ש-Compute Engine מבצע הקצאה מראש של מכונות ה-VM כדי לפנות קיבולת.
אתם משתמשים במודל הקצאת המשאבים לפי דרישה, שיש לו את היתרונות הבאים:
- יש לכם סיכוי גבוה יותר לקבל מעבדי GPU.
- אתם מקבלים הנחה של עד 91% על סוגים רבים של מכונות, יחידות GPU, יחידות TPU ודיסקים מקומיים של SSD.

איך משתמשים ב-Spot

כדי להשתמש ב-Spot ליצירת מכונות וירטואליות או אשכולות, צריך לבצע את השלבים הבאים:

איך בודקים את הזמינות של משאבים אפשר לראות את הזמינות של המשאבים באזור או בתחום שבו רוצים ליצור מכונות וירטואליות מסוג Spot. הפעולה הזו עוזרת לצמצם את הסיכויים להיתקל בשגיאות שקשורות לזמינות משאבים.

הוראות מפורטות זמינות במאמר בנושא צפייה בזמינות של מכונות וירטואליות מסוג Spot.
אופציונלי: צפייה בשיעור ההקצאה מראש ובמחירים. אפשר לראות את שיעור ההפקעה ההיסטורי והנוכחי ואת התמחור של סוגים שונים של מכונות ואזורים. המידע הזה עוזר לכם לבחור את סוג המכונה והמיקום שהכי מתאימים לעומס העבודה ולתקציב שלכם.

הוראות מפורטות במאמר בנושא צפייה בשיעור ההפקעה ובמחירים של מכונות Spot.
אופציונלי: יוצרים מדיניות למיקום קומפקטי או מדיניות לעומס עבודה. אתם יכולים ליצור מדיניות מיקום קומפקטית (למכונות וירטואליות עצמאיות או למכונות וירטואליות בכמות גדולה) או מדיניות עומס עבודה (ל-MIG) כדי לציין את הקרבה של המכונות הווירטואליות. ההגדרה שבחרתם משפיעה על סוגי המכונות ועל מספר המכונות הווירטואליות שהמדיניות תומכת בהן.

הוראות מפורטות זמינות במאמרים בנושא הפחתת זמן האחזור באמצעות מדיניות מיקום קומפקטית ויצירת מדיניות עומסי עבודה עבור קבוצות של מכונות מנוהלות (MIG).
איך יוצרים מכונות וירטואליות במודל Spot אפשר ליצור כמה מכונות וירטואליות שרוצים, בהתאם לזמינות. מכונות ה-VM פועלות עד שמפסיקים את הפעילות שלהן או מוחקים אותן, או עד שמערכת Compute Engine מפסיקה את הפעילות שלהן כדי לפנות קיבולת.

הוראות מפורטות מופיעות במאמר סקירה כללית של אפשרויות הפריסה.

בחירת אפשרות צריכה קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

השוואה בין אפשרויות הצריכה

בחירת אפשרות צריכה

שימוש בשריון מקום שמור לעתיד ב-AI Hypercomputer

עומסי עבודה אידיאליים להזמנות עתידיות ב-AI Hypercomputer

מאפיינים מרכזיים של הזמנות עתידיות ב-AI Hypercomputer

איך משתמשים בהזמנות עתידיות ב-AI Hypercomputer

שימוש בהזמנות עתידיות במצב יומן

עומסי עבודה אידיאליים להזמנות עתידיות במצב יומן

מאפיינים עיקריים של הזמנות עתידיות במצב יומן

איך משתמשים בהזמנות עתידיות במצב יומן

שימוש ב-Flex-start

עומסי עבודה אידיאליים ל-Flex-start

מאפיינים מרכזיים של Flex-start

איך משתמשים בשיטת התחלה גמישה

שימוש ב-Spot

עומסי עבודה אידיאליים ל-Spot

מאפיינים מרכזיים של Spot

איך משתמשים ב-Spot

בחירת אפשרות צריכה