Google Cloud מציעה מגוון שרתים מבוססי-Arm ב-Compute Engine באמצעות סדרות המכונות N4A, C4A bare metal (בגרסת Preview), C4A ו-A4X. ארכיטקטורת Arm מותאמת ליעילות בצריכת החשמל, ולכן יכולה להניב מחיר טוב יותר ביחס לביצועים.
מעבדי Arm נפוצים בשרתים רגילים בגלל היעילות שלהם בצריכת החשמל בהשוואה לשרתי x86. טלפונים ניידים ומחשבים ניידים הם דוגמאות למכשירים שפועלים על מעבד Arm. במעבד Arm, סט הפקודות מצומצם יותר, ולכן פחות פקודות שוות למהירות ביצועים גבוהה יותר עם צריכת סוללה וחשמל נמוכה יותר.
N4A משתמש במעבד Axion Arm של Google עם מעבד Neoverse N3. C4A משתמש במעבד Axion Arm שמבוסס על מעבד Arm Neoverse V2. Neoverse V2 הוא המעבד הראשון בסדרת V עם שיפורים בביצועים, בצריכת החשמל ובאבטחה של Armv9. היא מיועדת למחשוב עתיר ביצועים (HPC), ללמידת מכונה ולמחשוב ענן לשימוש כללי. כדאי להשתמש במכונות וירטואליות (VM) מסוג Arm למטרות כלליות N4A או C4A לכל אחת מהמטרות הבאות:
- הפעלת עומסי עבודה אינטנסיביים שדורשים יכולת התאמה מהירה של השימוש לפי הצורך.
- אופטימיזציה של עומסי עבודה (workloads) שתואמים ל-Arm, תוך התמקדות ביחס בין מחיר לביצועים.
- הפלטפורמה מבוססת על מחסניות תוכנה מודרניות בקוד פתוח.
- פיתוח ובדיקה של מערכות ניידות או מוטמעות שמשתמשות במעבד Arm.
- בודקים אם עומס העבודה מתאים ל-CPU מסוג Arm.
כדי להשתמש ב-GPU עם מעבד מבוסס-Arm, בוחרים במכונה מסוג A4X Max או A4X, שפועלת על ארכיטקטורת NVIDIA rack scale. למופעים בסדרות המכונות האלה מצורפים שבבי NVIDIA Grace Blackwell Superchips. סדרות המכונות האלה מותאמות לעומסי עבודה של מחשוב מקבילי מאסיבי של ארכיטקטורת מכשירים מאוחדת לחישוב (CUDA), כמו למידת מכונה (ML) ומחשוב עתיר ביצועים (HPC).
סדרת מכונות A4X Max ו-A4X
סדרות המכונות A4X Max ו-A4X כוללות גם מעבדי CPU מבוססי-Arm וגם GPU מצורף. לשני סוגי המכונות בסדרה הזו יש שני שקעים עם מעבדי NVIDIA Grace Arm שמחוברים לארבעה מעבדים גרפיים עם תקשורת מהירה בין שבבים (NVLink C2C).
- A4X Max: מציע סוגי מכונות עם עד 144 ליבות vCPU ו-960 GB של זיכרון. הוא משתמש ב-NVIDIA GB300 Superchips, שיש להם B300 GPUs שמציעים זיכרון בנפח 279GB לכל GPU. A4X Max זמין כמכונת Bare Metal בסוג המכונה
a4x-maxgpu-4g-metal. - A4X: מציע סוגי מכונות עם עד 140 vCPU ו-884 GB של זיכרון. הוא משתמש ב-Superchips של NVIDIA GB200, שיש להם מעבדים גרפיים (GPU) מסוג B200 שמציעים זיכרון של 186GB לכל GPU. A4X זמין בסוג המכונה
a4x-highgpu-4g.
אפשרויות אחסון למופעי A4X Max ו-A4X
אפשר להשתמש ב-A4X Max וב-A4X עם אחסון מצורף של Google Cloud Hyperdisk, והם מגיעים עם 12,000 GiB של Local SSD. מערכת Compute Engine מצרפת אוטומטית את דיסקי ה-SSD המקומיים למכונות במהלך יצירת המכונות.
קובצי אימג' של מערכת ההפעלה
מופעי A4X Max ו-A4X תומכים בקובצי אימג' של מערכת הפעלה ציבוריים מבוססי-Arm. אפשר גם ליצור תמונות בהתאמה אישית באמצעות קובץ אימג' ציבורי של מערכת הפעלה מבוססת-Arm.
N4A machine series
N4A היא המכונה הווירטואלית העדכנית ביותר מבוססת Google Axion, שנבנתה על מעבד Neoverse N3. סדרת N4A מציעה סוגי מכונות עם עד 64 ליבות vCPU ו-512GB של זיכרון DDR5, ותמיכה ביחידת עיבוד של תשתית (IPU) Titanium. N4A משתמש בניהול דינמי של משאבים מהדור הבא, והוא זמין בסוגי המכונות standard, highmem ו-highcpu עם אפשרות להתאמה אישית של סוג המכונה ולהוספה של זיכרון מורחב.
N4A תומך ברשתות סטנדרטיות עד 50 Gbps עם ממשק הרשת gVNIC. בנוסף, סוגי המכונות N4A תומכים בממשק הדיסק NVMe עם אחסון מסוג Hyperdisk Balanced, Hyperdisk Balanced High Availability ו-Hyperdisk Throughput.
סדרת מכונות C4A
C4A היא המכונה הווירטואלית הראשונה שמבוססת על Arm ונבנתה על המעבד Axion Arm64 מבית Google. ב-C4A מוצעים סוגי מכונות עם עד 72 ליבות vCPU ו-576GB של זיכרון DDR5. סוגי המכונות C4A זמינים ב-standard, highmem ו-highcpu.
C4A מציעה (בגרסת Preview) סוג מכונה highmem bare metal עם 96 ליבות vCPU וזיכרון DDR5 בנפח 768GB.
C4A מבוסס על Titanium, שמשתמש בהעברות נתונים ברשת ומאפשר ביצועים ברשת ברמה Tier_1 של מכונה וירטואלית של עד 100 Gbps עם ממשק הרשת gVNIC. C4A תומך גם בממשקי הדיסק NVMe ו-IDPF עם נפחי Hyperdisk.
Simultaneous multithreading
בסדרת מכונות C4A, כל vCPU מגובה על ידי ליבה אחת ללא ריבוי נימים סימולטני (SMT). לכן, מכונות וירטואליות מסוג C4A מספקות ביצועים טובים יותר לכל vCPU בהשוואה למכונה וירטואלית עם SMT מופעל. למרות ש-SMT מספק יתרונות לעומסי עבודה מסוימים, ליבות עם ת'רד יחיד הן אידיאליות לעומסי עבודה עתירי-חישוב, כי התהליכים יכולים לגשת לכל הליבה במקום לחלוק אותה עם תהליכים אחרים.
קובצי אימג' של מערכת ההפעלה
מכונות וירטואליות מסוג C4A ו-N4A תומכות בתמונות של מערכות הפעלה ציבוריות מבוססות-Arm. אפשר גם ליצור תמונות מותאמות אישית באמצעות תמונה מבוססת-Arm שזמינה לציבור.
Tau T2A machine series
סדרת המכונות Tau T2A Arm פועלת על מעבד Ampere Altra Arm עם 64 ליבות בתדר של 3.0 GHz בכל הליבות. הסדרה Tau T2A מאפשרת להריץ עומסי עבודה (workloads) שפועלים בצורה הטובה ביותר, או באופן בלעדי, ב-Arm.
סדרת המכונות Tau T2A כוללת סוגי מכונות עם קונפיגורציה מוגדרת (predefined) של עד 48 ליבות פיזיות עם 4GB של זיכרון לכל vCPU. סוגי המכונות Tau T2A פועלים בתוך צומת NUMA יחיד.
סוגי המכונות Tau T2A תומכים רק בממשק NVMe לאחסון, וב-Google virtual NIC (gVNIC) לרשת. אין תמיכה בממשקי Virtio-Net ו-SCSI. כל תמונות מערכת ההפעלה של Arm שזמינות לציבור מוגדרות לשימוש בממשקי NVMe ו-gVNIC. gVNIC הוא ממשק רשת שמיועד במיוחד ל-Compute Engine. הוא מספק ביצועים טובים יותר ותומך ברוחבי פס ובקצב העברת נתונים גבוהים יותר ברשת.
בסדרת המכונות הזו, כל vCPU מגובה על ידי ליבה אחת ללא ריבוי הליכי משנה סימולטני (SMT).
המלצות לעומסי עבודה
סדרת המכונות C4A היא בחירה מצוינת למגוון רחב של עומסי עבודה שדורשים הרחבה וחישובים אינטנסיביים, במיוחד כשביצועים ביחס למחיר הם שיקול מרכזי. כדאי להשתמש ב-C4A כשפורסים עומסי עבודה מהסוגים הבאים:
- עיבוד נתונים של למידת מכונה
- הסקת מסקנות על סמך מודלים של ML ופרסום מודלים
- הצגת אפליקציות, הצגת אתרים והצגת משחקים
- פיתוח מערכות מוטמעות
- פיתוח ב-CI/CD ב-Arm
- קידוד, המרה ועיבוד של סרטונים ותמונות
- בורסות לפרסום בדיגיטל והצגת מודעות
- שרתי מטמון
- גילוי תרופות באמצעות חישובים
- פיתוח Android
- פיתוח תוכנה אוטונומית או קונבנציונלית לרכב
המאמרים הבאים
- כדאי לעיין במפרטים ובתכונות של סדרת מכונות A4X Max ו-A4X.
- כדאי לעיין במפרט של סדרת המכונות N4A.
- כדאי לעיין במפרטים של סדרת מכונות C4A.
- מידע על פלטפורמות CPU זמינות ל- Google Cloud
- יצירה והפעלה של מכונה של Compute Engine באמצעות תמונת מערכת הפעלה של Arm.