מידע על הפעלה מהירה יותר של עומסי עבודה באמצעות צמתים עם הפעלה מהירה

בדף הזה תמצאו הסבר איך לפרוס ולהרחיב עומסי עבודה מהר יותר באשכולות Google Kubernetes Engine‏ (GKE) באמצעות צמתים עם הפעלה מהירה. נעשה שימוש בצמתים עם הפעלה מהירה ב-GKE עם מצב Autopilot על בסיס המאמץ הכי טוב, כשעומסי עבודה משתמשים בתצורות תואמות.

לצמתים של GKE עם הפעלה מהירה יש זמן הפעלה קצר משמעותית עבור משפחות מכונות תואמות. זמן ההפעלה המהיר יותר מספק לכם את היתרונות הבאים:

  • הפעלה מהירה יותר במצב התחלתי (cold start)
  • התאמה מהירה יותר לעומס (autoscaling)
  • שיפור בזמן האחזור של הזנב הארוך של תזמון הפודים
  • שיפור היעילות בעלויות התשתית

בעזרת צמתים עם הפעלה מהירה, GKE מבצע אתחול מראש של משאבי חומרה כדי לקצר את זמן ההפעלה. המשאבים שמוגדרים מראש זמינים על בסיס מאמץ מרבי. יכול להיות שרק חלק מהבקשות להגדלת נפח התנועה יטופלו. ללא צמתים עם הפעלה מהירה, המשאבים מאותחלים לפי דרישה, והצמתים מוגשים בזמן ההפעלה הרגיל.

דרישות

לא נדרשת הגדרה נוספת כדי להשתמש בצמתים שמתחילים לפעול במהירות. ‫GKE משתמש באופן אוטומטי בצמתים עם הפעלה מהירה אם עומסי העבודה שלכם משתמשים בהגדרות תואמות. כדי להשתמש בצמתים עם הפעלה מהירה, אתם צריכים לעמוד בכל הדרישות הבאות:

מגבלות

התכונות הבאות לא תואמות לצמתים של GKE עם הפעלה מהירה. אם אתם משתמשים באחת מהתכונות האלה, GKE מקצה צמתים עם זמן ההפעלה הרגיל:

עומסי עבודה של GPU בטייס אוטומטי

בקשה לשימוש ב-GPU תואם במצב Autopilot מביאה לקיצור של עד פי ארבעה בזמן ההפעלה של הצומת, ועד פי שניים בזמן התזמון של ה-Pod, בהשוואה לבקשות דומות במצב GKE Standard, כי עומסי העבודה של ה-GPU ב-Autopilot יכולים להשתמש בצמתים שמופעלים במהירות.

הנה כמה תרחישי שימוש לדוגמה. עם זאת, כל פוד שעומד בתנאים שבקטע דרישות תואם לצמתים עם הפעלה מהירה.

ComputeClass

מבקשים סוג תואם של מאיץ ומספר מאיצים ב-ComputeClass, כמו בדוגמה הבאה:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
  nodePoolAutoCreation:
    enabled: true

כשבוחרים את ComputeClass הזה ב-Pod, כמו בדוגמה הבאה,‏ GKE משתמש בצמתים עם הפעלה מהירה:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    # Select a ComputeClass that requests compatible GPUs
    cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

מחליפים את הערכים הבאים:

  • ACCELERATOR_COMPUTE_CLASS_NAME: השם של ComputeClass שמבקש את המאיצים.
  • ACCELERATOR_TYPE: סוג המאיץ.
  • ACCELERATOR_COUNT: מספר המאיצים שנדרשים ל-Pod. הערך הזה חייב להיות קטן מהערך בשדה spec.priorities.gpu.count ב-ComputeClass או שווה לו.
  • POD_NAME: השם של ה-Pod.

מידע נוסף על ComputeClass זמין במאמר מידע על מחלקות מחשוב בהתאמה אישית.

מפרט ה-Pod

בוחרים סוג תואם של מאיץ ומספר המאיצים במפרט ה-Pod, כמו בדוגמה הבאה:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

מחליפים את הערכים הבאים:

  • POD_NAME: השם של ה-Pod.
  • ACCELERATOR_NAME: השם של המאיץ שנדרש על ידי ה-Pod.
  • ACCELERATOR_COUNT: מספר המאיצים שנדרשים ל-Pod.

דרישות ההגדרה למשאבי מחשוב שעומדים בדרישות

בטבלאות שבסעיפים הבאים מפורטות הדרישות הספציפיות של GKE לאספקת משאבי מחשוב רלוונטיים כצמתים להפעלה מהירה.

פלטפורמת מחשוב שמותאמת לקונטיינרים ב-Autopilot

בהמשך מפורטות הדרישות של GKE להקצאת צמתים (nodes) עם הפעלה מהירה באמצעות פלטפורמת המחשוב שמותאמת לקונטיינרים של Autopilot.

משאב מחשוב תמיכה בערוץ הפצה ובגרסה סוגים וגדלים נתמכים של דיסקים
פלטפורמת מחשוב שמותאמת לקונטיינרים ב-Autopilot
  • ערוץ מהיר
  • ‫1.33.0-gke.1696000 ואילך

סדרת מכונות G2

כדי להקצות מכונות G2 ב-GKE כצמתים להפעלה מהירה, צריך לעמוד בדרישות הבאות.

משאב מחשוב תמיכה בערוץ הפצה ובגרסה סוגים וגדלים נתמכים של דיסקים
סדרת מכונות G2
  • ערוצים מהירים וערוצים רגילים
  • ‫1.31 ואילך

סדרת מכונות A2

כדי להקצות מכונות A2 ב-GKE כצמתים להפעלה מהירה, צריך לעמוד בדרישות הבאות.

משאב מחשוב תמיכה בערוץ הפצה ובגרסה סוגים וגדלים נתמכים של דיסקים
סוגי מכונות A2 Standard
  • ערוצים מהירים וערוצים רגילים
  • ‫1.32.0-gke.1008000 ואילך
סוגי מכונות A2 Ultra
  • ערוצים מהירים וערוצים רגילים
  • ‫1.32.0-gke.1008000 ואילך
  • pd-balanced או pd-ssd דיסקים לאתחול עד 1,000 GiB, עם מגבלות גבוהות יותר ל-a2‑ultragpu‑4g (1,500 GiB) ול-a2‑ultragpu‑8g (3,000 GiB).
  • עם כונני SSD מקומיים שמצורפים באופן אוטומטי.

תמחור

צמתים עם הפעלה מהירה זמינים ב-GKE Autopilot ללא תוספת תשלום. מידע נוסף על התמחור של GKE Autopilot זמין בקטע 'מצב Autopilot' במאמר תמחור של Google Kubernetes Engine.

המאמרים הבאים