פלטפורמות של מעבדים (CPU)

כשיוצרים מכונה וירטואלית (VM) או מכונת Bare Metal באמצעות Compute Engine, צריך לציין את סדרת המכונות ואת סוג המכונה של המכונה. סוג המכונה קובע את פלטפורמת ה-CPU שעליה פועל מופע החישוב.

פלטפורמת CPU מציעה כמה מעבדים פיזיים, וכל אחד מהמעבדים האלה נקרא ליבה. במעבדים שזמינים ב-Compute Engine, ליבת מעבד אחת יכולה לפעול ככמה תהליכי שרשור חומרה באמצעות Simultaneous multithreading (‏SMT), שנקרא במעבדי Intel בשם Intel Hyper-Threading Technology. ב-Compute Engine, כל ת'רד של חומרה נקרא מעבד וירטואלי (vCPU). חלק מסדרות המכונות לא משתמשות ב-SMT, ובמקום זאת כל vCPU מייצג ליבה. כשמדווחים על מעבדי vCPU למופע כעל מעבדים וירטואליים שונים, ‏ Compute Engine מוודא שהמעבדים הווירטואליים האלה אף פעם לא חולקים את אותו ליבה פיזית.

סוג המכונה של מופע Compute מציין את מספר יחידות ה-vCPU שלו, ואפשר להסיק את מספר ליבות ה-CPU הפיזיות שלו באמצעות יחס ברירת המחדל של vCPU לכל ליבה עבור סדרת המכונות הזו:

  • בסדרות המכונות C4A,‏ N4A,‏ T2D,‏ T2A,‏ H4D,‏ H3 ו-A4X, למכונות של Compute Engine תמיד יש מעבד וירטואלי אחד לכל ליבה.
  • בכל סדרות המכונות האחרות, למכונות הווירטואליות יש כברירת מחדל שתי ליבות וירטואליות לכל ליבה.

אפשר גם להגדיר את מספר ה-threads לכל ליבה לערך שאינו ברירת המחדל, מה שיכול להועיל לחלק מעומסי העבודה. חשוב לדעת: כשמבצעים את הפעולה הזו, סוג המכונה של מופע החישוב כבר לא משקף את המספר הנכון של ליבות vCPU. במקום זאת, התמחור ומספר ליבות המעבד הפיזיות נשארים זהים לאלה שמוגדרים כברירת מחדל עבור יחס של שני מעבדים וירטואליים לכל ליבה, ומספר המעבדים הווירטואליים הוא חצי מהערך שמצוין בסוג המכונה.

מעבדי x86

ברוב מעבדי x86, כל vCPU מיושם כשרשור חומרה יחיד.

מעבדים של Intel

במעבדי Intel Xeon, טכנולוגיית ה-Hyper-Threading של Intel תומכת בהרצת כמה תהליכים בו-זמנית בכל ליבה. סוג המכונה של מכונת החישוב קובע את מספר ה-vCPU והזיכרון שלה.

בסדרת המכונות H3 לא נעשה שימוש ב-hyper-threading, וכל vCPU מייצג ליבה פיזית אחת.

מעבד (CPU) מק"ט של המעבד סדרות וסוגים של מכונות נתמכים תדר בסיסי (GHz) תדירות טורבו בכל הליבות (GHz) תדר טורבו מקסימלי של ליבה אחת (GHz)
מעבד Intel Xeon Scalable
(Granite Rapids)
דור 6
מעבד Intel Xeon Platinum 6985P-C
‫2.81 3.9 ‫4.2
מעבד Intel Xeon Scalable
(Emerald Rapids)
דור 5
מעבד Intel Xeon Platinum 8581C
‫2.1 ‫2.9 4.0
‫2.3 ‫3.1 4.0
‫2.1 ‫2.9 3.3
מעבד Intel Xeon Scalable
(Sapphire Rapids)
דור 4
מעבד Intel Xeon Platinum 8490H ‫1.9 ‫2.9 ‫3.5
מעבד Intel Xeon Platinum 8481C ‫2.2 3.0 3.0
‫2.2 3.0 3.8
2.0 3.8 ‫2.9
מעבד Intel Xeon Scalable (Ice Lake)
דור שלישי
מעבד Intel Xeon Platinum
8373C
2.6 3.4 ‫3.5
מעבד Intel Xeon Scalable (Cascade Lake)
דור שני
מעבד Intel Xeon Gold 6268CL 2.8 3.4 3.9
מעבד Intel Xeon Gold 6253CL ‫3.1 3.8 3.9
מעבד Intel Xeon Platinum 8280L 2.5 3.4 4.0
מעבד Intel Xeon Platinum 8273CL ‫2.2 ‫2.9 ‫3.7
מעבד Intel Xeon Scalable (Skylake)
דור ראשון
מעבד Intel Xeon Scalable Platinum 8173M 2.0 2.7 ‫3.5
Intel Xeon E7 (Broadwell E7) מעבד Intel Xeon E7-8880V4 ‫2.2 2.6 3.3
Intel Xeon E5 v4 (Broadwell E5) מעבד Intel Xeon E5-2696V4 ‫2.2 2.8 ‫3.7
Intel Xeon E5 v3 (Haswell) מעבד Intel Xeon E5-2696V3 ‫2.3 2.8 3.8
‫Intel Xeon E5 v2 (Ivy Bridge) מעבד Intel Xeon E5-2696V2 2.5 ‫3.1 ‫3.5
Intel Xeon E5 (Sandy Bridge) מעבד Intel Xeon E5-2689 2.6 ‫3.2 3.6

‫1סוגי מכונות C4 שמשתמשים ביחידת העיבוד המרכזית (CPU) של Intel Granite Rapids כוללים תדר בסיסי של 2.8, אבל vPMU יציג 2.3 לצורכי תאימות.

2סוגי מכונות N2 עם 96 או יותר vCPU דורשים מעבד Intel Ice Lake.

מעבדי AMD

מעבדי AMD מספקים ביצועים ואפשרויות הרחבה אופטימליים באמצעות SMT. ברוב המקרים, Compute Engine משתמש בשני שרשורים לכל ליבה, וכל vCPU הוא שרשור אחד. החריגים הם H4D ו-Tau T2D, שבהם Compute Engine משתמש בשרשור אחד לכל ליבה, וכל vCPU ממופה לליבה פיזית.

סוג המכונה של מכונת ה-Compute קובע את מספר ליבות ה-vCPU ואת כמות הזיכרון שהוקצו למכונה.

מעבד (CPU) מק"ט של המעבד סדרות מכונות נתמכות תדר בסיסי (GHz) תדירות אפקטיבית (GHz) תדר מקסימלי של טורבו (GHz)
‫AMD EPYC Turin
דור חמישי
AMD EPYC 9B45 2.7 ‫3.5 ‫4.1
‫AMD EPYC Genoa
דור רביעי
AMD EPYC 9B14 2.6 3.3 ‫3.7
‫AMD EPYC Milan
דור שלישי
AMD EPYC 7B13 2.45 2.8 ‫3.5

התנהגות התדירות

בטבלאות הקודמות מתוארות מפרטי החומרה של המעבדים שזמינים ב-Compute Engine, אבל חשוב לזכור את הנקודות הבאות:

  • תדירות: התדירות של מחשב, או מהירות השעון, מודדת את מספר המחזורים שהמעבד מבצע בשנייה, ונמדדת ב-GHz (גיגה-הרץ). באופן כללי, תדירויות גבוהות יותר מעידות על ביצועים טובים יותר. עם זאת, עיצובים שונים של מעבדים מטפלים בהוראות בצורה שונה, ולכן מעבד ישן יותר עם מהירות שעון גבוהה יותר יכול להיות פחות יעיל ממעבד חדש יותר עם מהירות שעון נמוכה יותר, כי הארכיטקטורה החדשה מטפלת בהוראות בצורה יעילה יותר.

  • תדר בסיסי: התדר שבו יחידת העיבוד המרכזית (CPU) פועלת כשהמערכת במצב סרק או בעומס נמוך. כשמריצים את המעבד בתדר הבסיסי שלו, הוא צורך פחות חשמל ומפיק פחות חום.

    סביבת האורח של מופע חישוב משקפת את תדר הבסיס, בלי קשר לתדר שבו המעבד פועל בפועל.

  • תדר טורבו של כל הליבות: התדר שבו כל ליבת CPU פועלת בדרך כלל כשכל הליבות בתושבת לא נמצאות במצב סרק באותו זמן. עומסי עבודה שונים יוצרים דרישות שונות ממעבד המערכת. טכנולוגיות ה-Boost מטפלות בהבדל הזה ועוזרות לתהליכים להסתגל לדרישות העומס על ידי הגדלת התדירות של המעבד.

    • רוב המקרים של מחשוב מקבלים את תדר הטורבו של כל הליבות, גם אם רק התדר הבסיסי מפורסם בסביבת האורח.
    • מעבדי Ampere Altra Arm יכולים לספק ביצועים צפויים יותר כי התדירות של מעבדי Arm היא תמיד תדירות הטורבו של כל הליבות.
    • אפשר להריץ מופעי C4 בתדר טורבו מקסימלי בכל הליבות על ידי הגדרת השדה AdvancedMachineFeature לערך ALL_CORE_MAX. אם השדה הזה לא מוגדר, המופע פועל בהגדרת ברירת המחדל, שהיא תדירות לא מוגבלת.

      ההגדרה ALL_CORE_MAX לא זמינה עם מכונות וירטואליות מסוג C4D או C4A.

  • תדירות טורבו מקסימלית: התדירות שהמעבד מכוון אליה כשהוא נתון לעומס של אפליקציה תובענית כמו משחק וידאו או אפליקציה לעיצוב מודלים. התדר המקסימלי של ליבה יחידה שאליו מגיע המעבד בלי המהרה.

  • טכנולוגיות לניהול צריכת החשמל של המעבד: מעבדי Intel תומכים בכמה טכנולוגיות לאופטימיזציה של צריכת החשמל. הטכנולוגיות האלה מחולקות לשתי קטגוריות, או מצבים:

    • מצבי C הם מצבים שבהם המעבד (CPU) צמצם או השבית פונקציות מסוימות.
    • מצבי P מספקים דרך לשנות את התדירות והמתח שבהם המעבד פועל, כדי להפחית את צריכת החשמל של ה-CPU.

    כל סוגי המכונות C4, וסוגים מסוימים של מכונות C2 ‏ (30, ‏ 60 vCPU), ‏ C2D ‏ (56, ‏ 112 vCPU) ו-M2 ‏ (208, ‏ 416 vCPU) תומכים ברמזים למצב C שסופקו על ידי המכונה באמצעות ההוראה MWAIT.

    מכונות Compute Engine לא מספקות אמצעים לשליטה במצבי P על ידי הלקוח.

סוגי מכונות שתומכים בכמה פלטפורמות של מעבדים

לכל אזור של Compute Engine יש פלטפורמת CPU שמוגדרת כברירת מחדל לכל סוג מכונה. אחרי שיוצרים את המופע, כדי לראות את הערך של פלטפורמת ברירת המחדל של ה-CPU, אפשר להתחבר למערכת ההפעלה של האורח ולהשתמש בפקודה lscpu. המדד הזה נקרא גם מעבד אורח. השימוש במעבד של האורח במופע לא משתנה בזמן שהמופע פועל.

חלק מסוגי המכונות יכולים לפעול ביותר מפלטפורמת CPU אחת. עבור סוגי המכונות האלה, אפשר לציין פלטפורמת CPU מינימלית למכונה. אם לא מציינים ערך ל-CPU המינימלי של המופע, או אם משתמשים בערך Automatic לפלטפורמת ה-CPU המינימלית, מופע ה-Compute משתמש בפלטפורמת ה-CPU שמוגדרת כברירת מחדל שמשויכת לסוג המכונה ולאזור. הפרמטר נקרא minimum CPU כי כשהוא מוגדר, אפשר לארח את מופע ה-Compute רק בשרתים שמשתמשים במעבדים מהסוג שצוין או במעבדים מדור חדש יותר.

פלטפורמת ה-CPU שמוגדרת כברירת מחדל לאזור מסוים יכולה להשתנות בנסיבות מסוימות. אם פלטפורמת ה-CPU שמוגדרת כברירת מחדל לסוג המכונה משתנה באזור שבו המכונה פועלת, מערכת ההפעלה של האורח תציג את פלטפורמת ה-CPU החדשה אם תפסיקו ותפעילו מחדש את המכונה.

אם אתם רוצים שמכונת החישוב תמיד תשתמש בפלטפורמת ה-CPU שמוגדרת כברירת מחדל ושבאמצעותה היא נוצרה, אתם צריכים להגדיר את ה-CPU המינימלי למכונה לאותו ערך כמו פלטפורמת ה-CPU שמוגדרת כברירת מחדל. כך מוודאים שמעבד האורח יישאר זהה עבור המופע כל עוד פלטפורמת המעבד הזו נתמכת.

אפשר להריץ את סוגי המכונות הבאים ביותר מפלטפורמת CPU אחת:

סוגי מכונות פלטפורמות CPU נתמכות ערכי CPU מינימליים
(בנוסף לערך `Automatic`)
סוגי מכונות C4 עם:
  • ‫144 מעבדים וירטואליים
  • ‫288 vCPU
  • דיסקים מצורפים של Titanium SSD
Intel Granite Rapids Intel Granite Rapids
סוגי מכונות C4 עם:
  • ‫192 vCPU וללא דיסקים מסוג Titanium SSD
  • פחות מ-144 vCPU ואין דיסקים מסוג Titanium SSD
  • Intel Granite Rapids
  • Intel Emerald Rapids
  • ‫Intel Granite Rapids1
  • Intel Emerald Rapids
E2
  • Intel Broadwell
  • AMD EPYC Milan
לא זמין
‫N2 עם פחות מ-96 vCPU
  • Intel Cascade Lake
  • Intel Ice Lake
  • Intel Cascade Lake
  • Intel Ice Lake
‫N2 עם 96 או יותר vCPU Intel Ice Lake Intel Ice Lake
N1
  • Intel Sandy Bridge
  • Intel Ivy Bridge
  • Intel Haswell
  • Intel Broadwell
  • Intel Skylake
  • Intel Sandy Bridge
  • Intel Ivy Bridge
  • Intel Haswell
  • Intel Broadwell
  • Intel Skylake

1 זמין רק באזורים נבחרים, כפי שמתואר במאמר בנושא זמינות אזורית של מעבדי C4 מינימליים

זמינות אזורית של מעבד C4 מינימלי

מכונות C4 יכולות לפעול בפלטפורמת המעבד Intel Granite Rapids או Intel Emerald Rapids. עם זאת, האפשרות לציין Intel Granite Rapids בכל הצורות מוגבלת לאזורים ולסביבות ספציפיים, כפי שמתואר בטבלה הבאה.

תחומים מיקום תמיכה ב-MinCPU
asia-south2-a
asia-south2-c
דלהי, הודו, אסיה-פסיפיק (APAC) כן
asia-southeast3-b בנגקוק, תאילנד, אסיה-פסיפיק (APAC) כן
europe-north1-b
europe-north1-c
האמינה, פינלנד, אירופה כן
europe-southwest1-b מדריד, ספרד, אירופה כן
europe-west4-ai1a דה קוי, הולנד, אירופה כן
europe-west6-a ציריך, שווייץ, אירופה כן
europe-west8-c מילאנו, איטליה, אירופה כן
northamerica-northeast1-a מונטריאול, קוויבק, צפון אמריקה כן
southamerica-west1-c סנטיאגו, צ'ילה, דרום אמריקה כן
us-west2-b לוס אנג'לס, קליפורניה, צפון אמריקה כן
us-west3-c סולט לייק סיטי, יוטה, צפון אמריקה כן

מעבדי ARM

במעבדי Arm, ‏ Compute Engine משתמש בשרשור אחד לכל ליבה. כל מעבד וירטואלי (vCPU) ממופה לליבה פיזית ללא SMT.

בטבלה הבאה מתוארים מעבדי Arm שזמינים למכונות Compute Engine.

מעבד (CPU) מק"ט של המעבד סדרות וסוגים של מכונות נתמכים
מעבדי NVIDIA Grace עם ליבות Arm Neoverse V2 Superchip A4X Max ו-A4X
מעבדי Google Axion עם ליבות Neoverse V2 Armv9 C4A
מעבדי Google Axion עם ליבות Neoverse N3 Armv9.2 N4A
ליבות Ampere Altra Arm Neoverse N1 Q64-30 Tau T2A

תכונות המעבד (CPU)

יצרני שבבים מוסיפים למעבדים שהם מייצרים טכנולוגיות מתקדמות לחישובים, לגרפיקה, לווירטואליזציה ולניהול זיכרון. Google Cloud תומך בשימוש בחלק מהתכונות המתקדמות האלה ב-Compute Engine.

תוספים מתקדמים של וקטורים

‫Advanced Vector Extensions (AVX) הם הרחבות של הוראה יחידה, נתונים מרובים (SIMD) לארכיטקטורת סט הפקודות x86 למיקרו-מעבדים של Intel ו-Advanced Micro Devices (AMD). ‫AVX מספק הוראות חדשות וסכמת קידוד חדשה.

מידע נוסף זמין במאמר בנושא תוספי וקטור מתקדמים.

‫AVX זמין בכל מעבדי x86 שמשמשים את Compute Engine.

‫Advanced Vector Extensions (AVX2)

‫AVX2 (שנקרא גם Haswell New Instructions) מוסיף את הפעולות הבאות ל-AVX:

  • הרחבת רוב ההוראות של SSE ו-AVX של מספרים שלמים בווקטור ל-256 ביטים
  • נוספה תמיכה בפונקציה Gather, שמאפשרת לטעון רכיבי וקטור ממיקומי זיכרון לא סמוכים
  • פרמוטציות מכל סוג עם גרנולריות של DWORD ו-QWORD
  • שינויים בווקטור

‫AVX2 זמין בפלטפורמות המעבדים הבאות:

  • מעבדי Intel Xeon E5 v3 ‏ (Haswell) ומעבדים חדשים יותר
  • כל מעבדי AMD

‫Advanced Vector Extensions (AVX512)

‫AVX-512 מרחיב את AVX לתמיכה ב-512 ביט באמצעות קידוד הקידומת EVEX. ‫AVX-512 מספק האצה מובנית לעומסי עבודה תובעניים שכוללים עיבוד כבד מבוסס-וקטורים. האוגר הגדול של מאיץ AVX-512 תומך ב-32 מספרים נקודה צפה כפולה וב-64 מספרים נקודה צפה יחידה, בנוסף ל-8 מספרים שלמים של 64 ביט ו-16 מספרים שלמים של 32 ביט.

למידע נוסף על AVX-512, אפשר לעיין במאמר מה זה Intel AVX-512?

‫AVX-512 זמין בפלטפורמות המעבדים הבאות:

  • מעבד Intel Xeon Scalable (Skylake) דור ראשון ומעבדים חדשים יותר
  • מעבדים מדור 4 ומעלה של AMD EPYC Genoa

תוספים מתקדמים של מטריצות

Intel Advanced Matrix Extensions (AMX) היא תוסף חדש לארכיטקטורת סט פקודות (ISA) שנועד להאיץ עומסי עבודה של בינה מלאכותית (AI) ולמידת מכונה (ML). ‫AMX מציג הוראות חדשות שאפשר להשתמש בהן כדי לבצע פעולות של כפל מטריצות וקונבולוציה, שהן שתיים מהפעולות הנפוצות ביותר ב-AI וב-ML.

‫AMX מציגה רגיסטרים דו-ממדיים שנקראים tiles, שבהם מאיצים יכולים לבצע פעולות. ‫AMX מיועדת להיות ארכיטקטורה ניתנת להרחבה. התאוצה הראשונה שהוטמעה נקראת יחידת כפל מטריצות של משבצות (TMUL). לכל ליבת CPU במעבד Sapphire Rapids יש יחידת AMX TMUL עצמאית.

פרטים טכניים על Intel AMX מופיעים במאמר תמיכה ב-Intel AMX בגרסה 5.16. ‫Intel מציעה הדרכה בנושא AMX בכתובת Code Sample: Intel Advanced Matrix Extensions (Intel AMX) - Intrinsics Functions.

‫AMX זמין במעבדי Intel Xeon מדור רביעי (Sapphire Rapids) ומעלה. ‫AMX לא זמין במעבדי AMD או Arm.

הדרישות לשימוש ב-AMX

להוראות Intel AMX יש דרישות מינימליות מסוימות לגבי תוכנה, כמו:

  • במקרה של תמונות בהתאמה אישית, יש תמיכה ב-AMX בגרסה 5.16 של ליבת Linux ומעלה.
  • ‫Compute Engine מציע תמיכה ב-AMX בקובצי האימג' הציבוריים הבאים:
    • CentOS Stream 9
    • ‫מערכת הפעלה שמותאמת לקונטיינרים 109 LTS ואילך
    • ‫RHEL 8 (הגרסה העדכנית ביותר) ואילך
    • ‫Rocky Linux 8 (הגרסה האחרונה) ואילך
    • ‫Ubuntu 22.04 ואילך
    • ‫Windows Server 2022 ואילך
  • Tensorflow גרסה 2.9.1 ואילך
  • תוסף Intel ל-Intel Optimization for PyTorch

תכונות של יחידת העיבוד המרכזית (CPU) שזמינות למופעים של שרתים פיזיים

בנוסף למשאבי המחשוב הגולמיים של השרת, מכונות Bare Metal שפועלות במעבדי Intel Xeon Scalable מדור רביעי ואילך יכולות להשתמש במספר האצות והעברות עומס ספציפיות לפונקציות:

  • Intel-QAT: טכנולוגיית Intel QuickAssist ‏ (Intel QAT) מאיצה דחיסה, הצפנה ופענוח
  • Intel-DLB: Intel Dynamic Load Balancer (מאזן עומסים דינמי של Intel,‏ Intel DLB) עוזר להאיץ את התורים של הנתונים
  • Intel IAA: ‏Intel In-Memory Analytics Accelerator (Intel IAA)‎ משפר את ביצועי עיבוד השאילתות.
  • Intel DSA: ‏Intel Data Streaming Accelerator (מאיץ להזרמת נתונים של Intel,‏ Intel DSA) עוזר להעתיק ולהעביר נתונים מהר יותר.

Confidential Computing

כדי להגן על הנתונים בזמן השימוש בהם, אפשר להשתמש בפלטפורמות CPU שתומכות בטכנולוגיות של Confidential Computing כדי ליצור מופעים של Confidential VM.

מידע נוסף על הדרישות ליצירת מופע של מכונה וירטואלית חסויה זמין במאמר תצורות נתמכות.

המאמרים הבאים

נסו בעצמכם

אנחנו ממליצים למשתמשים חדשים ב-Google Cloud ליצור חשבון כדי שיוכלו להעריך את הביצועים של Compute Engine באמצעות תרחישים ממשיים. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300 $להרצה, לבדיקה ולפריסה של עומסי העבודה.

אני רוצה לנסות את Compute Engine בחינם