סקירה כללית של אפשרויות הפריסה

כדי להריץ עומסי עבודה של בינה מלאכותית (AI), למידת מכונה (ML) או מחשוב עתיר ביצועים (HPC), אתם יכולים לפרוס מכונות וירטואליות (VM) ואשכולות של Compute Engine שעברו אופטימיזציה ל-AI, ומשתמשים במכונות A4X,‏ A4,‏ A3 Ultra,‏ A3 Mega ו-A3 High (עם 8 יחידות GPU). מידע נוסף על התכונות של המכונות האלה שמאפשרות להריץ אשכולות AI ו-ML בקנה מידה גדול זמין במאמר סקירה כללית על ניהול אשכולות.

אפשר ליצור מכונות A4X, ‏ A4, ‏ A3 Ultra, ‏ A3 Mega ו-A3 High (עם 8 יחידות GPU) ישירות מ-Compute Engine, או דרך שירותים אחרים שפועלים במכונות של Compute Engine, כמו Cluster Toolkit או Google Kubernetes Engine.

כדי לבחור את האפשרות המתאימה ביותר ליצירת מכונות או אשכולות וירטואליים לתרחיש השימוש שלכם, אפשר לבחור באחת מהאפשרויות הבאות:

אפשרות תרחיש לדוגמה
Cluster Director אתם רוצים שירות מנוהל מלא שמבצע אוטומטית את ההגדרה של אשכולות Slurm. ‫Cluster Director עוזר לכם להגדיר משאבי מחשוב, רשת ואחסון עבור האשכולות שלכם כדי למקסם את הביצועים ולמזער את זמן ההשבתה. מידע נוסף מופיע במאמר בנושא יצירת אשכול Slurm בניהול מלא לעומסי עבודה של AI.
Cluster Toolkit

אתם רוצים להשתמש בתוכנת קוד פתוח שתפשט את התהליך של פריסת אשכולות Slurm ו-GKE. ה-Cluster Toolkit נועד להיות גמיש מאוד וניתן להרחבה. אתם יכולים להשתמש בתוכניות כדי להקצות משאבי רשת ואחסון. למידע נוסף, אפשר לעיין במאמרים הבאים:

GKE אתם רוצים גמישות מקסימלית בהגדרת אשכול Google Kubernetes Engine בהתאם לצרכים של עומס העבודה. מידע נוסף זמין במאמר יצירת אשכול Google Kubernetes Engine מותאם אישית ל-AI.
שימוש ב-Compute Engine

אתם רוצים שליטה מלאה בשכבת התשתית כדי שתוכלו להגדיר כלי תזמור משלכם. מידע נוסף זמין במאמרים הבאים:

המאמרים הבאים