Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

מידע על הפעלה מהירה יותר של עומסי עבודה באמצעות צמתים עם הפעלה מהירה

Autopilot

בדף הזה תמצאו הסבר איך לפרוס ולהרחיב עומסי עבודה מהר יותר באשכולות Google Kubernetes Engine‏ (GKE) באמצעות צמתים עם הפעלה מהירה. נעשה שימוש בצמתים עם הפעלה מהירה ב-GKE עם מצב Autopilot על בסיס המאמץ הכי טוב, כשעומסי עבודה משתמשים בתצורות תואמות.

לצמתים של GKE עם הפעלה מהירה יש זמן הפעלה קצר משמעותית עבור משפחות מכונות תואמות. זמן ההפעלה המהיר יותר מספק לכם את היתרונות הבאים:

הפעלה מהירה יותר במצב התחלתי (cold start)
התאמה מהירה יותר לעומס (autoscaling)
שיפור בזמן האחזור של הזנב הארוך של תזמון הפודים
שיפור היעילות בעלויות התשתית

בעזרת צמתים עם הפעלה מהירה, GKE מבצע אתחול מראש של משאבי חומרה כדי לקצר את זמן ההפעלה. המשאבים שמוגדרים מראש זמינים על בסיס מאמץ מרבי. יכול להיות שרק חלק מהבקשות להגדלת נפח התנועה יטופלו. ללא צמתים עם הפעלה מהירה, המשאבים מאותחלים לפי דרישה, והצמתים מוגשים בזמן ההפעלה הרגיל.

דרישות

לא נדרשת הגדרה נוספת כדי להשתמש בצמתים שמתחילים לפעול במהירות. ‫GKE משתמש באופן אוטומטי בצמתים עם הפעלה מהירה אם עומסי העבודה שלכם משתמשים בהגדרות תואמות. כדי להשתמש בצמתים עם הפעלה מהירה, אתם צריכים לעמוד בכל הדרישות הבאות:

להשתמש באשכולות Autopilot או להפעיל עומסי עבודה במצב Autopilot באשכולות Standard.
אל תשתמשו בתכונות שלא תואמות לצמתים עם הפעלה מהירה. מידע נוסף מופיע במאמר בנושא מגבלות.
משתמשים באחד ממשאבי המחשוב הבאים, שמתוארים בטבלאות המתאימות בקטע דרישות התצורה למשאבי מחשוב שעומדים בדרישות:

מגבלות

התכונות הבאות לא תואמות לצמתים של GKE עם הפעלה מהירה. אם אתם משתמשים באחת מהתכונות האלה, GKE מקצה צמתים עם זמן ההפעלה הרגיל:

‫G2 עם גרסת מנהל ההתקן של GPU בגרסאות GKE מוקדמות יותר מ-1.33.0-gke.1304000.DEFAULT בגרסה 1.33.0-gke.1304000 ואילך, גם LATEST וגם DEFAULT פועלות עם צמתים שמופעלים במהירות.
דיסקים משניים לאתחול בגרסאות קודמות ל-1.33.2-gke.1015000.
מפתחות הצפנה בניהול הלקוח (CMEK)
VMs במודל Spot
מדיניות בנושא מיקומי מודעות
תמיכה במספר רשתות

עומסי עבודה של GPU בטייס אוטומטי

בקשה לשימוש ב-GPU תואם במצב Autopilot מביאה לקיצור של עד פי ארבעה בזמן ההפעלה של הצומת, ועד פי שניים בזמן התזמון של ה-Pod, בהשוואה לבקשות דומות במצב GKE Standard, כי עומסי העבודה של ה-GPU ב-Autopilot יכולים להשתמש בצמתים שמופעלים במהירות.

הנה כמה תרחישי שימוש לדוגמה. עם זאת, כל פוד שעומד בתנאים שבקטע דרישות תואם לצמתים עם הפעלה מהירה.

ComputeClass

מבקשים סוג תואם של מאיץ ומספר מאיצים ב-ComputeClass, כמו בדוגמה הבאה:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
  nodePoolAutoCreation:
    enabled: true

כשבוחרים את ComputeClass הזה ב-Pod, כמו בדוגמה הבאה,‏ GKE משתמש בצמתים עם הפעלה מהירה:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    # Select a ComputeClass that requests compatible GPUs
    cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

מחליפים את הערכים הבאים:

‫ACCELERATOR_COMPUTE_CLASS_NAME: השם של ComputeClass שמבקש את המאיצים.
‫ACCELERATOR_TYPE: סוג המאיץ.
‫ACCELERATOR_COUNT: מספר המאיצים שנדרשים ל-Pod. הערך הזה חייב להיות קטן מהערך בשדה spec.priorities.gpu.count ב-ComputeClass או שווה לו.
‫POD_NAME: השם של ה-Pod.

מידע נוסף על ComputeClass זמין במאמר מידע על מחלקות מחשוב בהתאמה אישית.

מפרט ה-Pod

בוחרים סוג תואם של מאיץ ומספר המאיצים במפרט ה-Pod, כמו בדוגמה הבאה:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

מחליפים את הערכים הבאים:

‫POD_NAME: השם של ה-Pod.
‫ACCELERATOR_NAME: השם של המאיץ שנדרש על ידי ה-Pod.
‫ACCELERATOR_COUNT: מספר המאיצים שנדרשים ל-Pod.

דרישות ההגדרה למשאבי מחשוב שעומדים בדרישות

בטבלאות שבסעיפים הבאים מפורטות הדרישות הספציפיות של GKE לאספקת משאבי מחשוב רלוונטיים כצמתים להפעלה מהירה.

פלטפורמת מחשוב שמותאמת לקונטיינרים ב-Autopilot

בהמשך מפורטות הדרישות של GKE להקצאת צמתים (nodes) עם הפעלה מהירה באמצעות פלטפורמת המחשוב שמותאמת לקונטיינרים של Autopilot.

משאב מחשוב	תמיכה בערוץ הפצה ובגרסה	סוגים וגדלים נתמכים של דיסקים
פלטפורמת מחשוב שמותאמת לקונטיינרים ב-Autopilot	ערוץ מהיר ‫1.33.0-gke.1696000 ואילך	‫`pd-balanced` דיסקים לאתחול בנפח של עד ‎100 GiB אין אחסון SSD מקומי.

סדרת מכונות G2

כדי להקצות מכונות G2 ב-GKE כצמתים להפעלה מהירה, צריך לעמוד בדרישות הבאות.

משאב מחשוב	תמיכה בערוץ הפצה ובגרסה	סוגים וגדלים נתמכים של דיסקים
סדרת מכונות G2	ערוצים מהירים וערוצים רגילים ‫1.31 ואילך	`pd-balanced` דיסקים לאתחול עד 500 GiB אין אחסון SSD מקומי.

סדרת מכונות A2

כדי להקצות מכונות A2 ב-GKE כצמתים להפעלה מהירה, צריך לעמוד בדרישות הבאות.

משאב מחשוב	תמיכה בערוץ הפצה ובגרסה	סוגים וגדלים נתמכים של דיסקים
סוגי מכונות A2 Standard	ערוצים מהירים וערוצים רגילים ‫1.32.0-gke.1008000 ואילך	`pd-balanced` או `pd-ssd` דיסקים לאתחול עד 1,000 GiB. אין אחסון SSD מקומי.
סוגי מכונות A2 Ultra	ערוצים מהירים וערוצים רגילים ‫1.32.0-gke.1008000 ואילך	‫`pd-balanced` או `pd-ssd` דיסקים לאתחול עד 1,000 GiB, עם מגבלות גבוהות יותר ל-`a2‑ultragpu‑4g` (1,500 GiB) ול-`a2‑ultragpu‑8g` (3,000 GiB). עם כונני SSD מקומיים שמצורפים באופן אוטומטי.

תמחור

צמתים עם הפעלה מהירה זמינים ב-GKE Autopilot ללא תוספת תשלום. מידע נוסף על התמחור של GKE Autopilot זמין בקטע 'מצב Autopilot' במאמר תמחור של Google Kubernetes Engine.

מידע על הפעלה מהירה יותר של עומסי עבודה באמצעות צמתים עם הפעלה מהירה קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.