התכונה הזו מאפשרת לכם לבחור פלטפורמת CPU מינימלית לאשכולות של Managed Service for Apache Spark. לדוגמה, כשיוצרים אשכול, אפשר לבחור מעבדי Intel Skylake לצמתי האשכול כדי לשפר את ביצועי העבודה.
לפני שמשתמשים בתכונה הזו, כדאי לעיין במאמר אזורים ואזורי זמינות, שבו מפורטות הפלטפורמות שזמינות בכל אזור. אפשר גם להריץ את הפקודה gcloud compute zones describe zone כדי להציג את availableCpuPlatforms באזור של האשכול. מידע נוסף זמין במאמר בנושא הגדרת פלטפורמת מעבד מינימלית למכונות וירטואליות.
שימוש בפלטפורמת מעבד מינימלית
המסוף
כדי לציין פלטפורמת מעבד מינימלית לצמתי אשכול:
- פותחים את הדף Create cluster.
- בקטע Worker configuration (הגדרת העובד), בקטע CPU platform and GPU (פלטפורמת CPU ו-GPU), מאשרים או בוחרים פלטפורמת CPU.
- כברירת מחדל, ההגדרות של צומת ה-driver (הראשי) זהות להגדרות של העובד הראשי. בקטע הגדרה נוספת, אפשר לערוך את צומת דרייבר כדי לבטל את הסימון של התיבה צומת דרייבר שמוגדר כברירת מחדל זהה לצומת העובד הראשי, ואז לציין את ההגדרות של צומת דרייבר.
פקודה ב-CLI של gcloud
כדי לציין פלטפורמת CPU מינימלית לצמתי ה-master או ה-worker של האשכול (כולל צמתים שניתן לקטוע), מעבירים את אחד מהדגלים הבאים או את שניהם לפקודה gcloud dataproc clusters create:
gcloud dataproc clusters create \ --region=region \ --master-min-cpu-platform=cpu-platform-name \ --worker-min-cpu-platform=cpu-platform-name \ other args ...
API בארכיטקטורת REST
כדי לציין פלטפורמת CPU מינימלית לצומתי העובדים הראשיים, המשניים (שניתנים להפסקת פעולה) או הראשיים של האשכול, צריך להגדיר את השדה minCpuPlatform ב-InstanceGroupConfig עבור המופעים הראשיים, המשניים (שניתנים להפסקת פעולה) או הראשיים בבקשת cluster.create.