בדף הזה תמצאו הסבר איך לפרוס ולהרחיב עומסי עבודה מהר יותר באשכולות Google Kubernetes Engine (GKE) באמצעות צמתים עם הפעלה מהירה. נעשה שימוש בצמתים עם הפעלה מהירה ב-GKE עם מצב Autopilot על בסיס המאמץ הכי טוב, כשעומסי עבודה משתמשים בתצורות תואמות.
לצמתים של GKE עם הפעלה מהירה יש זמן הפעלה קצר משמעותית עבור משפחות מכונות תואמות. זמן ההפעלה המהיר יותר מספק לכם את היתרונות הבאים:
- הפעלה מהירה יותר במצב התחלתי (cold start)
- התאמה מהירה יותר לעומס (autoscaling)
- שיפור בזמן האחזור של הזנב הארוך של תזמון הפודים
- שיפור היעילות בעלויות התשתית
בעזרת צמתים עם הפעלה מהירה, GKE מבצע אתחול מראש של משאבי חומרה כדי לקצר את זמן ההפעלה. המשאבים שמוגדרים מראש זמינים על בסיס מאמץ מרבי. יכול להיות שרק חלק מהבקשות להגדלת נפח התנועה יטופלו. ללא צמתים עם הפעלה מהירה, המשאבים מאותחלים לפי דרישה, והצמתים מוגשים בזמן ההפעלה הרגיל.
דרישות
לא נדרשת הגדרה נוספת כדי להשתמש בצמתים שמתחילים לפעול במהירות. GKE משתמש באופן אוטומטי בצמתים עם הפעלה מהירה אם עומסי העבודה שלכם משתמשים בהגדרות תואמות. כדי להשתמש בצמתים עם הפעלה מהירה, אתם צריכים לעמוד בכל הדרישות הבאות:
- להשתמש באשכולות Autopilot או להפעיל עומסי עבודה במצב Autopilot באשכולות Standard.
- אל תשתמשו בתכונות שלא תואמות לצמתים עם הפעלה מהירה. מידע נוסף מופיע במאמר בנושא מגבלות.
משתמשים באחד ממשאבי המחשוב הבאים, שמתוארים בטבלאות המתאימות בקטע דרישות התצורה למשאבי מחשוב שעומדים בדרישות:
מגבלות
התכונות הבאות לא תואמות לצמתים של GKE עם הפעלה מהירה. אם אתם משתמשים באחת מהתכונות האלה, GKE מקצה צמתים עם זמן ההפעלה הרגיל:
- G2 עם גרסת מנהל ההתקן של GPU בגרסאות GKE מוקדמות יותר מ-1.33.0-gke.1304000.
DEFAULTבגרסה 1.33.0-gke.1304000 ואילך, גםLATESTוגםDEFAULTפועלות עם צמתים שמופעלים במהירות. - דיסקים משניים לאתחול בגרסאות קודמות ל-1.33.2-gke.1015000.
- מפתחות הצפנה בניהול הלקוח (CMEK)
- VMs במודל Spot
- מדיניות בנושא מיקומי מודעות
- תמיכה במספר רשתות
עומסי עבודה של GPU בטייס אוטומטי
בקשה לשימוש ב-GPU תואם במצב Autopilot מביאה לקיצור של עד פי ארבעה בזמן ההפעלה של הצומת, ועד פי שניים בזמן התזמון של ה-Pod, בהשוואה לבקשות דומות במצב GKE Standard, כי עומסי העבודה של ה-GPU ב-Autopilot יכולים להשתמש בצמתים שמופעלים במהירות.
הנה כמה תרחישי שימוש לדוגמה. עם זאת, כל פוד שעומד בתנאים שבקטע דרישות תואם לצמתים עם הפעלה מהירה.
ComputeClass
מבקשים סוג תואם של מאיץ ומספר מאיצים ב-ComputeClass, כמו בדוגמה הבאה:
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
priorities:
- gpu:
type: ACCELERATOR_TYPE
count: ACCELERATOR_COUNT
nodePoolAutoCreation:
enabled: true
כשבוחרים את ComputeClass הזה ב-Pod, כמו בדוגמה הבאה, GKE משתמש בצמתים עם הפעלה מהירה:
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
# Select a ComputeClass that requests compatible GPUs
cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
containers:
- name: my-container
image: registry.k8s.io/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
מחליפים את הערכים הבאים:
-
ACCELERATOR_COMPUTE_CLASS_NAME: השם של ComputeClass שמבקש את המאיצים. -
ACCELERATOR_TYPE: סוג המאיץ. -
ACCELERATOR_COUNT: מספר המאיצים שנדרשים ל-Pod. הערך הזה חייב להיות קטן מהערך בשדהspec.priorities.gpu.countב-ComputeClass או שווה לו. -
POD_NAME: השם של ה-Pod.
מידע נוסף על ComputeClass זמין במאמר מידע על מחלקות מחשוב בהתאמה אישית.
מפרט ה-Pod
בוחרים סוג תואם של מאיץ ומספר המאיצים במפרט ה-Pod, כמו בדוגמה הבאה:
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
cloud.google.com/gke-accelerator: ACCELERATOR_NAME
containers:
- name: my-container
image: registry.k8s.io/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
מחליפים את הערכים הבאים:
-
POD_NAME: השם של ה-Pod. -
ACCELERATOR_NAME: השם של המאיץ שנדרש על ידי ה-Pod. -
ACCELERATOR_COUNT: מספר המאיצים שנדרשים ל-Pod.
דרישות ההגדרה למשאבי מחשוב שעומדים בדרישות
בטבלאות שבסעיפים הבאים מפורטות הדרישות הספציפיות של GKE לאספקת משאבי מחשוב רלוונטיים כצמתים להפעלה מהירה.
פלטפורמת מחשוב שמותאמת לקונטיינרים ב-Autopilot
בהמשך מפורטות הדרישות של GKE להקצאת צמתים (nodes) עם הפעלה מהירה באמצעות פלטפורמת המחשוב שמותאמת לקונטיינרים של Autopilot.
| משאב מחשוב | תמיכה בערוץ הפצה ובגרסה | סוגים וגדלים נתמכים של דיסקים |
|---|---|---|
| פלטפורמת מחשוב שמותאמת לקונטיינרים ב-Autopilot |
|
|
סדרת מכונות G2
כדי להקצות מכונות G2 ב-GKE כצמתים להפעלה מהירה, צריך לעמוד בדרישות הבאות.
| משאב מחשוב | תמיכה בערוץ הפצה ובגרסה | סוגים וגדלים נתמכים של דיסקים |
|---|---|---|
| סדרת מכונות G2 |
|
|
סדרת מכונות A2
כדי להקצות מכונות A2 ב-GKE כצמתים להפעלה מהירה, צריך לעמוד בדרישות הבאות.
| משאב מחשוב | תמיכה בערוץ הפצה ובגרסה | סוגים וגדלים נתמכים של דיסקים |
|---|---|---|
| סוגי מכונות A2 Standard |
|
|
| סוגי מכונות A2 Ultra |
|
|
תמחור
צמתים עם הפעלה מהירה זמינים ב-GKE Autopilot ללא תוספת תשלום. מידע נוסף על התמחור של GKE Autopilot זמין בקטע 'מצב Autopilot' במאמר תמחור של Google Kubernetes Engine.
המאמרים הבאים
- מידע על פלטפורמת מחשוב שמותאמת לקונטיינרים ב-Autopilot
- מידע על מחלקות מותאמות אישית של מחשוב
- סקירה כללית של הביצועים של Persistent Disk