פלטפורמות של מעבדים (CPU)

כשיוצרים מכונה וירטואלית (VM) או מכונת Bare Metal באמצעות Compute Engine, צריך לציין את סדרת המכונות ואת סוג המכונה של המכונה. כל סדרת מכונות משויכת לפלטפורמת CPU אחת או יותר. אם יש כמה פלטפורמות CPU זמינות לסדרת מכונות, אפשר לבחור פלטפורמת CPU מינימלית למכונת החישוב.

פלטפורמת CPU מציעה כמה מעבדים פיזיים, וכל אחד מהמעבדים האלה נקרא ליבה. במעבדים שזמינים ב-Compute Engine, ליבת מעבד אחת יכולה לפעול ככמה תהליכי חומרה באמצעות Simultaneous multithreading (‏SMT), שנקרא במעבדי Intel בשם Intel Hyper-Threading Technology. ב-Compute Engine, כל ת'רד של חומרה נקרא מעבד וירטואלי (vCPU). בסדרות מסוימות של מכונות לא נעשה שימוש ב-SMT, וכל vCPU מייצג ליבה. כשמדווחים על מעבדי vCPU למופע כעל ליבות וירטואליות שונות, ‏ Compute Engine מוודא שמעבדי ה-vCPU האלה אף פעם לא חולקים את אותה ליבה פיזית.

סוג המכונה של מופע Compute מציין את מספר יחידות ה-vCPU שלו, ואפשר להסיק את מספר ליבות ה-CPU הפיזיות שלו באמצעות יחס ברירת המחדל של vCPU לכל ליבה עבור סדרת המכונות הזו:

  • בסדרות המכונות C4A,‏ N4A,‏ T2D,‏ T2A,‏ H4D,‏ H3 ו-A4X, למכונות של Compute Engine תמיד יש מעבד וירטואלי אחד לכל ליבה.
  • בכל שאר סדרות המכונות, למופעי החישוב יש כברירת מחדל שני מעבדים וירטואליים לכל ליבה.

אפשר גם להגדיר את מספר השרשורים לכל ליבה לערך שאינו ברירת המחדל, מה שיכול להועיל לחלק מעומסי העבודה. חשוב לדעת: כשמבצעים את הפעולה הזו, סוג המכונה של מופע החישוב כבר לא משקף את המספר הנכון של ליבות vCPU. במקום זאת, התמחור ומספר ליבות ה-CPU הפיזי נשארים זהים לאלה שמוגדרים כברירת מחדל עבור יחס של שתי יחידות vCPU לכל ליבה, ומספר יחידות ה-vCPU הוא חצי מהערך שמצוין בסוג המכונה.

מעבדי ARM

במעבדי Arm, ‏ Compute Engine משתמש בשרשור אחד לכל ליבה. כל vCPU ממופה לליבה פיזית ללא SMT.

בטבלה הבאה מתוארים מעבדי Arm שזמינים למכונות Compute Engine.

מעבד (CPU) מק"ט של המעבד סדרות וסוגים של מכונות נתמכים
מעבדי NVIDIA Grace עם ליבות Arm Neoverse V2 Superchip A4X Max ו-A4X
מעבדי Google Axion עם ליבות Neoverse V2 Armv9 C4A
מעבדי Google Axion עם ליבות Neoverse N3 Armv9.2 N4A
ליבות Ampere Altra Arm Neoverse N1 Q64-30 Tau T2A

מעבדי x86

ברוב מעבדי x86, כל vCPU מיושם כשרשור חומרה יחיד.

מעבדי Intel

במעבדי Intel Xeon, טכנולוגיית Intel Hyper-Threading תומכת בכמה תהליכים שפועלים בו-זמנית בכל ליבה. סוג המכונה של מכונת החישוב קובע את מספר יחידות ה-vCPU והזיכרון שלה.

בסדרת המכונות H3 לא נעשה שימוש ב-hyper-threading, וכל vCPU מייצג ליבה פיזית אחת.

מעבד (CPU) מק"ט של המעבד סדרות וסוגים של מכונות נתמכים תדר בסיסי (GHz) תדירות טורבו בכל הליבות (GHz) תדר טורבו מקסימלי של ליבה אחת (GHz)
מעבד Intel Xeon Scalable
(Granite Rapids)
דור 6
מעבד Intel Xeon Platinum 6985P-C
‫2.81 3.9 ‫4.2
מעבד Intel Xeon Scalable
(Emerald Rapids)
דור 5
מעבד Intel Xeon Platinum 8581C
‫2.1 2.9 4.0
‫2.3 ‫3.1 4.0
‫2.1 2.9 3.3
מעבד Intel Xeon Scalable
(Sapphire Rapids)
דור 4
מעבד Intel Xeon Platinum 8490H ‫1.9 2.9 3.5
מעבד Intel Xeon Platinum 8481C ‫2.2 3.0 3.0
‫2.2 3.0 3.8
2.0 3.8 2.9
מעבד Intel Xeon Scalable (Ice Lake)
דור 3
מעבד Intel Xeon Platinum
8373C
‫2.6 3.4 3.5
מעבד Intel Xeon Scalable (Cascade Lake)
דור שני
מעבד Intel Xeon Gold 6268CL 2.8 3.4 3.9
מעבד Intel Xeon Gold 6253CL ‫3.1 3.8 3.9
מעבד Intel Xeon Platinum 8280L 2.5 3.4 4.0
מעבד Intel Xeon Platinum 8273CL ‫2.2 2.9 ‫3.7
מעבד Intel Xeon Scalable (Skylake)
דור ראשון
מעבד Intel Xeon Scalable Platinum 8173M 2.0 2.7 3.5
Intel Xeon E7 (Broadwell E7) מעבד Intel Xeon E7-8880V4 ‫2.2 ‫2.6 3.3
Intel Xeon E5 v4 (Broadwell E5) מעבד Intel Xeon E5-2696V4 ‫2.2 2.8 ‫3.7
Intel Xeon E5 v3 (Haswell) מעבד Intel Xeon E5-2696V3 ‫2.3 2.8 3.8
‫Intel Xeon E5 v2 (Ivy Bridge) מעבד Intel Xeon E5-2696V2 2.5 ‫3.1 3.5
Intel Xeon E5 (Sandy Bridge) מעבד Intel Xeon E5-2689 ‫2.6 ‫3.2 3.6

‫1סוגי מכונות C4 שמשתמשות ביחידת העיבוד המרכזית (CPU) של Intel Granite Rapids כוללים תדר בסיסי של 2.8, אבל vPMU יציג 2.3 לצורכי תאימות.

2סוגי מכונות N2 עם 96 או יותר ליבות vCPU דורשים מעבד Intel Ice Lake.

מעבדי AMD

מעבדי AMD מספקים ביצועים ואפשרויות הרחבה אופטימליים באמצעות SMT. ברוב המקרים, Compute Engine משתמש בשני שרשורים לכל ליבה, וכל vCPU הוא שרשור אחד. החריגים הם H4D ו-Tau T2D, שבהם Compute Engine משתמש בשרשור אחד לכל ליבה, וכל vCPU ממופה לליבה פיזית.

סוג המכונה של מכונת החישוב קובע את מספר יחידות ה-vCPU ואת כמות הזיכרון שהוקצו למכונה.

מעבד (CPU) מק"ט של המעבד סדרות מכונות נתמכות תדר בסיסי (GHz) תדירות אפקטיבית (GHz) תדר טורבו מקסימלי (GHz)
‫AMD EPYC Turin
דור חמישי
AMD EPYC 9B45 2.7 3.5 ‫4.1
‫AMD EPYC Genoa
דור רביעי
AMD EPYC 9B14 ‫2.6 3.3 ‫3.7
AMD EPYC Milan
דור שלישי
AMD EPYC 7B13 2.45 2.8 3.5

התנהגות התדירות

בטבלאות הקודמות מתוארות מפרטי החומרה של המעבדים שזמינים ב-Compute Engine, אבל חשוב לזכור את הנקודות הבאות:

  • תדירות: התדירות של מחשב, או מהירות השעון שלו, מודדת את מספר המחזורים שהמעבד מבצע בשנייה, ונמדדת ב-GHz (גיגה-הרץ). באופן כללי, תדירויות גבוהות יותר מעידות על ביצועים טובים יותר. עם זאת, עיצובים שונים של מעבדים מטפלים בהוראות בצורה שונה, ולכן מעבד ישן יותר עם מהירות שעון גבוהה יותר יכול להיות בעל ביצועים נמוכים יותר ממעבד חדש יותר עם מהירות שעון נמוכה יותר, כי הארכיטקטורה החדשה יותר מטפלת בהוראות בצורה יעילה יותר.

  • תדר בסיסי: התדר שבו מעבד (CPU) פועל כשהמערכת במצב בלי פעילות או בעומס נמוך. כשמעבד פועל בתדר הבסיסי שלו, הוא צורך פחות חשמל ומפיק פחות חום.

    סביבת האורח של מופע חישוב משקפת את תדירות הבסיס, בלי קשר לתדירות שבה המעבד פועל בפועל.

  • תדר טורבו של כל הליבות: התדר שבו כל ליבת מעבד (CPU) פועלת בדרך כלל כשכל הליבות בתושבת לא נמצאות בלי פעילות באותו זמן. עומסי עבודה שונים יוצרים דרישות שונות ממעבד המערכת. טכנולוגיות לשיפור הביצועים מטפלות בהבדל הזה ועוזרות לתהליכים להסתגל לדרישות העומס על ידי הגדלת התדירות של המעבד.

    • רוב המקרים של מחשוב מקבלים את תדר הטורבו של כל הליבות, גם אם רק התדר הבסיסי מפורסם בסביבת האורח.
    • מעבדי Ampere Altra Arm יכולים לספק ביצועים צפויים יותר כי התדירות של מעבדי Arm היא תמיד תדירות הטורבו של כל הליבות.
    • אפשר להפעיל מופעי C4 בתדר טורבו מקסימלי בכל הליבות על ידי הגדרת השדה AdvancedMachineFeature לערך ALL_CORE_MAX. אם השדה הזה לא מוגדר, המופע פועל בהגדרת ברירת המחדל, שהיא תדירות לא מוגבלת.

      ההגדרה ALL_CORE_MAX לא זמינה עם מכונות וירטואליות מסוג C4D או C4A.

  • תדירות טורבו מקסימלית: התדירות שהמעבד מכוון אליה כשהוא נתון לעומס של אפליקציה תובענית כמו משחק וידאו או אפליקציה לעיצוב מודלים. זהו התדר המקסימלי של ליבה יחידה שהמעבד משיג בלי המהרה.

  • טכנולוגיות לניהול צריכת החשמל של המעבד: מעבדי Intel תומכים בכמה טכנולוגיות לאופטימיזציה של צריכת החשמל. הטכנולוגיות האלה מחולקות לשתי קטגוריות, או מצבים:

    • מצבי C הם מצבים שבהם המעבד (CPU) צמצם או השבית פונקציות נבחרות.
    • מצבי P מספקים דרך לשנות את התדירות והמתח שבהם המעבד פועל, כדי להפחית את צריכת החשמל של ה-CPU.

    כל סוגי המכונות C4, וסוגים מסוימים של מכונות C2 ‏ (30, ‏ 60 vCPU), ‏ C2D ‏ (56, ‏ 112 vCPU) ו-M2 ‏ (208, ‏ 416 vCPU) תומכים ברמזים למצב C שסופקו על ידי המכונה באמצעות ההוראה MWAIT.

    מכונות Compute Engine לא מספקות אמצעים לשליטה במצבי P על ידי הלקוח.

תכונות של מעבד (CPU)

יצרני שבבים מוסיפים ל-CPU שהם מייצרים טכנולוגיות מתקדמות לחישובים, לגרפיקה, לווירטואליזציה ולניהול זיכרון. Google Cloud תומך בשימוש בחלק מהתכונות המתקדמות האלה ב-Compute Engine.

תוספים מתקדמים של וקטורים

‫Advanced Vector Extensions (AVX)‎ הן הרחבות של Single Instruction, Multiple Data (SIMD)‎ (הוראה יחידה, נתונים מרובים) לארכיטקטורת סט הפקודות x86 למיקרו-מעבדים של Intel ו-Advanced Micro Devices (AMD). ‫AVX מספק הוראות חדשות וסכמת קידוד חדשה.

מידע נוסף זמין במאמר בנושא תוספי וקטור מתקדמים.

‫AVX זמין בכל מעבדי x86 שמשמשים את Compute Engine.

‫Advanced Vector Extensions (AVX2)

‫AVX2 (שנקרא גם Haswell New Instructions) מוסיף את הפעולות הבאות ל-AVX:

  • הרחבת רוב ההוראות של SSE ו-AVX של מספרים שלמים בווקטור ל-256 ביטים
  • נוספה תמיכה בפעולת Gather, שמאפשרת לטעון רכיבי וקטור ממיקומי זיכרון לא סמוכים
  • פרמוטציות מכל סוג עם רמת פירוט של DWORD ו-QWORD
  • הזזת וקטורים

‫AVX2 זמין בפלטפורמות המעבדים הבאות:

  • מעבדי Intel Xeon E5 v3 ‏ (Haswell) ומעלה
  • כל מעבדי AMD

תוספי וקטור מתקדמים (AVX512)

‫AVX-512 מרחיב את AVX לתמיכה ב-512 ביט באמצעות קידוד הקידומת EVEX. ‫AVX-512 מספק האצה מובנית לעומסי עבודה תובעניים שכוללים עיבוד כבד מבוסס-וקטורים. האוגר הגדול של מאיץ AVX-512 תומך ב-32 מספרים עם נקודה צפה בדיוק כפול וב-64 מספרים עם נקודה צפה בדיוק יחיד, בנוסף ל-8 מספרים שלמים של 64 ביט ו-16 מספרים שלמים של 32 ביט.

למידע נוסף על AVX-512, אפשר לעיין במאמר מה זה Intel AVX-512?

‫AVX-512 זמין בפלטפורמות הבאות של מעבדים:

  • מעבד Intel Xeon Scalable (Skylake) דור ראשון ומעבדים חדשים יותר
  • מעבדים מדור 4 ומעלה של AMD EPYC Genoa

תוספים מתקדמים של מטריצות

Intel Advanced Matrix Extensions (AMX) היא תוסף חדש לארכיטקטורת סט פקודות (ISA) שנועד להאיץ עומסי עבודה של בינה מלאכותית (AI) ולמידת מכונה (ML). ‫AMX כולל הוראות חדשות שאפשר להשתמש בהן כדי לבצע פעולות של כפל מטריצות וקונבולוציה, שהן שתיים מהפעולות הנפוצות ביותר ב-AI וב-ML.

‫AMX מציגה רגיסטרים דו-ממדיים שנקראים tiles, שבהם מאיצים יכולים לבצע פעולות. ‫AMX מיועדת להיות ארכיטקטורה ניתנת להרחבה. התאוצה הראשונה שהוטמעה נקראת יחידת כפל מטריצות של משבצות (TMUL). לכל ליבת CPU של מעבד Sapphire Rapids יש יחידת AMX TMUL עצמאית.

פרטים טכניים על Intel AMX מופיעים במאמר תמיכה ב-Intel AMX בגרסה 5.16. ‫Intel מציעה הדרכה בנושא AMX בכתובת Code Sample: Intel Advanced Matrix Extensions (Intel AMX) - Intrinsics Functions.

‫AMX זמין במעבדי Intel Xeon מדור רביעי (Sapphire Rapids) ומעלה. ‫AMX לא זמין במעבדי AMD או Arm.

הדרישות לשימוש ב-AMX

להוראות Intel AMX יש דרישות מינימליות מסוימות לגבי תוכנה, כמו:

  • לגבי תמונות בהתאמה אישית, יש תמיכה ב-AMX בגרסת ליבה 5.16 של Linux ומעלה.
  • ‫Compute Engine מציע תמיכה ב-AMX בקובצי האימג' הציבוריים הבאים:
    • ‫CentOS Stream 9
    • ‫מערכת הפעלה שמותאמת לקונטיינרים 109 LTS ואילך
    • ‫RHEL 8 (גרסת ה-build האחרונה) ואילך
    • ‫Rocky Linux 8 (הגרסה האחרונה) ואילך
    • ‫Ubuntu 22.04 ואילך
    • ‫Windows Server 2022 ואילך
  • Tensorflow גרסה 2.9.1 ואילך
  • תוסף Intel ל-Intel Optimization for PyTorch

תכונות של CPU שזמינות למופעי Bare Metal

בנוסף למשאבי המחשוב הגולמיים של השרת, מכונות Bare Metal שפועלות במעבדי Intel Xeon Scalable מדור רביעי ואילך יכולות להשתמש במספר האצות והעברות עומס ספציפיות לפונקציות:

  • Intel-QAT: טכנולוגיית Intel QuickAssist‏ (Intel QAT) מאיצה דחיסה, הצפנה ופענוח
  • Intel-DLB: Intel Dynamic Load Balancer (מאזן עומסים דינמי של Intel,‏ Intel DLB) עוזר להאיץ את התורים של הנתונים
  • Intel IAA: ‏Intel In-Memory Analytics Accelerator (מאיץ ניתוח נתונים בזיכרון של Intel,‏ Intel IAA) משפר את הביצועים של עיבוד שאילתות.
  • Intel DSA: Intel Data Streaming Accelerator (מאיץ להזרמת נתונים של Intel,‏ Intel DSA) עוזר להעתיק ולהעביר נתונים מהר יותר.

Confidential Computing

כדי להגן על הנתונים בזמן השימוש בהם, אפשר להשתמש בפלטפורמות CPU שתומכות בטכנולוגיות של Confidential Computing כדי ליצור מופעים של Confidential VM.

מידע נוסף על הדרישות ליצירת מופע של מכונה וירטואלית חסויה זמין במאמר תצורות נתמכות.

המאמרים הבאים

נסו בעצמכם

אנחנו ממליצים למשתמשים חדשים ב-Google Cloud ליצור חשבון כדי שיוכלו להעריך את הביצועים של Compute Engine בתרחישים מהעולם האמיתי. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300 $להרצה, לבדיקה ולפריסה של עומסי העבודה.

אני רוצה לנסות את Compute Engine בחינם