סוגי מכונות עם GPU

במסמך הזה מתוארות סדרות המכונות עם GPU שנתמכות ב-AI Hypercomputer. אתם יכולים ליצור מכונות וירטואליות וקלאסטרים של Compute Engine שמשתמשים בסדרות המכונות האלה כדי להריץ את עומסי העבודה של הבינה המלאכותית (AI), למידת המכונה (ML) והמחשוב בעל הביצועים הגבוהים (HPC).

כדי להשתמש במעבדי GPU ב-AI Hypercomputer, אפשר להשתמש ברוב סדרות המכונות ממשפחת המכונות שעברו אופטימיזציה להאצת ביצועים. כל סדרת מכונות במשפחת המכונות שעברו אופטימיזציה לשימוש במאיצים משתמשת במודל GPU ספציפי. מידע נוסף על משפחת המכונות שעברו אופטימיזציה להאצה זמין במאמר משפחת המכונות שעברו אופטימיזציה להאצה.

בקטע הבא מתוארות סדרות המכונות שעברו אופטימיזציה לשימוש במאיצים, ושנתמכות על ידי AI Hypercomputer.

A4X Max ו-A4X series

בקטע הזה מפורטות ההגדרות הזמינות לסדרות המכונות A4X Max ו-A4X. מידע נוסף על סדרות המכונות האלה זמין במאמר בנושא סדרות מכונות מסוג A4X ו-A4X Max שעברו אופטימיזציה להאצה במאמרי העזרה של Compute Engine.

A4X Max (Bare metal)

סוגי מכונות A4X Max משתמשים ב-NVIDIA GB300 Grace Blackwell Ultra Superchips (nvidia-gb300) והם אידיאליים לאימון מודלים בסיסיים ולמילוי בקשות. סוגי המכונות A4X Max זמינים כמכונות Bare Metal.

‫A4X Max היא פלטפורמה בקנה מידה אקססקייל שמבוססת על NVIDIA GB300 NVL72. לכל מכונה יש שני שקעים עם מעבדי NVIDIA Grace עם ליבות Arm Neoverse V2. יחידות העיבוד המרכזיות האלה מחוברות לארבע יחידות GPU מסוג NVIDIA B300 Blackwell עם תקשורת מהירה בין שבבים (NVLink-C2C).

מצורפים שבבי NVIDIA GB300 Grace Blackwell Ultra Superchips
סוג המכונה מספר המעבדים הווירטואליים1 זיכרון המכונה (GB) אחסון SSD מקומי מצורף (GiB) מספר כרטיסי ה-NIC הפיזיים רוחב הפס המקסימלי ברשת (Gbps)2 מספר יחידות ה-GPU זיכרון GPU3
(GB HBM3e)
a4x-maxgpu-4g-metal 144 960 ‫12,000 6 3,600 4 1,116

1vCPU מיושם כהיפר-ת'רד יחיד בחומרה באחת מפלטפורמות ה-CPU הזמינות.
2 רוחב הפס המקסימלי של התעבורה היוצאת לא יכול להיות גבוה מהמספר שצוין. רוחב הפס בפועל של התעבורה היוצאת תלוי בכתובת ה-IP של היעד ובגורמים אחרים. מידע נוסף על רוחב פס ברשת זמין במאמר רוחב פס ברשת.
3זיכרון GPU הוא הזיכרון במכשיר GPU שאפשר להשתמש בו לאחסון זמני של נתונים. הזיכרון הזה נפרד מהזיכרון של המופע, והוא מיועד במיוחד לטיפול בדרישות רוחב הפס הגבוהות יותר של עומסי עבודה עתירי גרפיקה.

A4X

‫A4X סוגי המכונות משתמשים ב-NVIDIA GB200 Grace Blackwell Superchips‏ (nvidia-gb200) והם אידיאליים לאימון מודלים בסיסיים ולהצגתם.

‫A4X היא פלטפורמה בקנה מידה אקססקייל שמבוססת על NVIDIA GB200 NVL72. לכל מכונה יש שני שקעים עם מעבדי NVIDIA Grace עם ליבות Arm Neoverse V2. המעבדים האלה מחוברים לארבע יחידות GPU מסוג NVIDIA B200 Blackwell עם תקשורת מהירה בין שבבים (NVLink-C2C).

מצורפים שבבי NVIDIA GB200 Grace Blackwell Superchips
סוג המכונה מספר המעבדים הווירטואליים1 זיכרון המכונה (GB) אחסון SSD מקומי מצורף (GiB) מספר כרטיסי ה-NIC הפיזיים רוחב הפס המקסימלי ברשת (Gbps)2 מספר יחידות ה-GPU זיכרון GPU3
(GB HBM3e)
a4x-highgpu-4g 140 884 ‫12,000 6 2,000 4 744

1vCPU מיושם כהיפר-ת'רד יחיד בחומרה באחת מפלטפורמות ה-CPU הזמינות.
2 רוחב הפס המקסימלי של התעבורה היוצאת לא יכול להיות גבוה מהמספר שצוין. רוחב הפס בפועל של התעבורה היוצאת תלוי בכתובת ה-IP של היעד ובגורמים אחרים. מידע נוסף על רוחב פס ברשת זמין במאמר רוחב פס ברשת.
3זיכרון GPU הוא הזיכרון במכשיר GPU שאפשר להשתמש בו לאחסון זמני של נתונים. הזיכרון הזה נפרד מהזיכרון של המופע, והוא מיועד במיוחד לטיפול בדרישות רוחב הפס הגבוהות יותר של עומסי עבודה עתירי גרפיקה.

A4 series

בקטע הזה מפורטות ההגדרות הזמינות לסדרת המכונות A4. למידע נוסף על סדרת המכונות הזו, אפשר לעיין במאמר סדרת מכונות A4 שעברו אופטימיזציה להאצה במסמכי העזרה של Compute Engine.

A4

לסוגי המכונות A4 מצורפים מעבדי GPU של NVIDIA B200 Blackwell (nvidia-b200), והם אידיאליים לאימון מודלים בסיסיים ולהצגתם.

מעבדים גרפיים (GPU) מסוג NVIDIA B200 Blackwell מצורפים
סוג המכונה מספר המעבדים הווירטואליים1 זיכרון המכונה (GB) אחסון SSD מקומי מצורף (GiB) מספר כרטיסי ה-NIC הפיזיים רוחב הפס המקסימלי ברשת (Gbps)2 מספר יחידות ה-GPU זיכרון GPU3
(GB HBM3e)
a4-highgpu-8g 224 3,968 ‫12,000 10 3,600 8 1,440

1vCPU מיושם כהיפר-ת'רד יחיד בחומרה באחת מפלטפורמות ה-CPU הזמינות.
2 רוחב הפס המקסימלי של התעבורה היוצאת לא יכול להיות גבוה מהמספר שצוין. רוחב הפס בפועל של התעבורה היוצאת תלוי בכתובת ה-IP של היעד ובגורמים אחרים. מידע נוסף על רוחב פס ברשת זמין במאמר בנושא רוחב פס ברשת.
3זיכרון GPU הוא הזיכרון במכשיר GPU שאפשר להשתמש בו לאחסון זמני של נתונים. הזיכרון הזה נפרד מהזיכרון של המופע, והוא מיועד במיוחד לטיפול בדרישות רוחב הפס הגבוהות יותר של עומסי עבודה עתירי גרפיקה.

A3 series

בקטע הזה מפורטות ההגדרות הזמינות לסדרת המכונות A3. למידע נוסף על סדרת המכונות הזו, אפשר לעיין במאמר סדרת מכונות A3 שעברה אופטימיזציה להאצה במסמכי העזרה של Compute Engine.

A3 Ultra

לסוגי המכונות A3 Ultra מצורפים מעבדים גרפיים (GPU) מסוג NVIDIA H200 SXM (nvidia-h200-141gb), והם מספקים את ביצועי הרשת הגבוהים ביותר בסדרת A3. סוגי המכונות A3 Ultra הם אידיאליים לאימון מודלים בסיסיים ולהצגתם.

מעבדי GPU של NVIDIA H200 שמצורפים
סוג המכונה מספר המעבדים הווירטואליים1 זיכרון המכונה (GB) אחסון SSD מקומי מצורף (GiB) מספר כרטיסי ה-NIC הפיזיים רוחב הפס המקסימלי ברשת (Gbps)2 מספר יחידות ה-GPU זיכרון GPU3
(GB HBM3e)
a3-ultragpu-8g 224 2,952 ‫12,000 10 3,600 8 1128

1vCPU מיושם כהיפר-ת'רד יחיד בחומרה באחת מפלטפורמות ה-CPU הזמינות.
2 רוחב הפס המקסימלי של התעבורה היוצאת לא יכול להיות גבוה מהמספר שצוין. רוחב הפס בפועל של התעבורה היוצאת תלוי בכתובת ה-IP של היעד ובגורמים אחרים. מידע נוסף על רוחב פס ברשת זמין במאמר רוחב פס ברשת.
3זיכרון GPU הוא הזיכרון במכשיר GPU שאפשר להשתמש בו לאחסון זמני של נתונים. הזיכרון הזה נפרד מהזיכרון של המופע, והוא מיועד במיוחד לטיפול בדרישות רוחב הפס הגבוהות יותר של עומסי עבודה עתירי גרפיקה.

A3 Mega

סוגי המכונות A3 Mega כוללים מעבדי NVIDIA H100 SXM GPU והם אידיאליים לאימון מודלים גדולים ולהסקת מסקנות במארחים מרובים.
מעבדי GPU מסוג NVIDIA H100 שמצורפים
סוג המכונה מספר המעבדים הווירטואליים1 זיכרון המכונה (GB) אחסון SSD מקומי מצורף (GiB) מספר כרטיסי ה-NIC הפיזיים רוחב הפס המקסימלי ברשת (Gbps)2 מספר יחידות ה-GPU זיכרון GPU3
(GB HBM3)
a3-megagpu-8g 208 1,872 6,000 9 ‫1,800 8 640

1vCPU מיושם כהיפר-ת'רד יחיד בחומרה באחת מפלטפורמות ה-CPU הזמינות.
2 רוחב הפס המקסימלי של התעבורה היוצאת לא יכול להיות גבוה מהמספר שצוין. רוחב הפס בפועל של התעבורה היוצאת תלוי בכתובת ה-IP של היעד ובגורמים אחרים. מידע נוסף על רוחב פס ברשת זמין במאמר רוחב פס ברשת.
3זיכרון GPU הוא הזיכרון במכשיר GPU שאפשר להשתמש בו לאחסון זמני של נתונים. הזיכרון הזה נפרד מהזיכרון של המופע, והוא מיועד במיוחד לטיפול בדרישות רוחב הפס הגבוהות יותר של עומסי עבודה עתירי גרפיקה.

A3 High

סוגי המכונות A3 High כוללים מעבדי GPU מסוג NVIDIA H100 SXM ומתאימים היטב הן להסקת מסקנות ממודלים גדולים והן לכוונון עדין של מודלים.
מעבדי GPU מסוג NVIDIA H100 שמצורפים
סוג המכונה מספר המעבדים הווירטואליים1 זיכרון המכונה (GB) אחסון SSD מקומי מצורף (GiB) מספר כרטיסי ה-NIC הפיזיים רוחב הפס המקסימלי ברשת (Gbps)2 מספר יחידות ה-GPU זיכרון GPU3
(GB HBM3)
a3-highgpu-1g 26 234 750 1 25 1 80
a3-highgpu-2g 52 468 1,500 1 50 2 160
a3-highgpu-4g 104 936 3,000 1 100 4 320
a3-highgpu-8g 208 1,872 6,000 5 1,000 8 640

1vCPU מיושם כהיפר-ת'רד יחיד בחומרה באחת מפלטפורמות ה-CPU הזמינות.
2 רוחב הפס המקסימלי של התעבורה היוצאת לא יכול להיות גבוה מהמספר שצוין. רוחב הפס בפועל של התעבורה היוצאת תלוי בכתובת ה-IP של היעד ובגורמים אחרים. מידע נוסף על רוחב פס ברשת זמין במאמר רוחב פס ברשת.
3זיכרון GPU הוא הזיכרון במכשיר GPU שאפשר להשתמש בו לאחסון זמני של נתונים. הזיכרון הזה נפרד מהזיכרון של המופע, והוא מיועד במיוחד לטיפול בדרישות רוחב הפס הגבוהות יותר של עומסי עבודה עתירי גרפיקה.

A3 Edge

סוגי המכונות A3 Edge כוללים מעבדי NVIDIA H100 SXM GPU ומיועדים במיוחד להצגת תוכן. הם זמינים בקבוצה מוגבלת של אזורים.
מעבדי GPU מסוג NVIDIA H100 שמצורפים
סוג המכונה מספר המעבדים הווירטואליים1 זיכרון המכונה (GB) אחסון SSD מקומי מצורף (GiB) מספר כרטיסי ה-NIC הפיזיים רוחב הפס המקסימלי ברשת (Gbps)2 מספר יחידות ה-GPU זיכרון GPU3
(GB HBM3)
a3-edgegpu-8g 208 1,872 6,000 5
  • ‫600: for asia-south1 and northamerica-northeast2
  • ‫400: לכל שאר אזורי A3 Edge
8 640

1vCPU מיושם כהיפר-ת'רד יחיד בחומרה באחת מפלטפורמות ה-CPU הזמינות.
2 רוחב הפס המקסימלי של התעבורה היוצאת לא יכול להיות גבוה מהמספר שצוין. רוחב הפס בפועל של התעבורה היוצאת תלוי בכתובת ה-IP של היעד ובגורמים אחרים. מידע נוסף על רוחב פס ברשת זמין במאמר רוחב פס ברשת.
3זיכרון GPU הוא הזיכרון במכשיר GPU שאפשר להשתמש בו לאחסון זמני של נתונים. הזיכרון הזה נפרד מהזיכרון של המופע, והוא מיועד במיוחד לטיפול בדרישות רוחב הפס הגבוהות יותר של עומסי עבודה עתירי גרפיקה.

המאמרים הבאים