במקום להפעיל תהליך עבודה באשכול מנוהל, אפשר להשתמש בכלי לבחירת אשכול כדי לבחור אשכול קיים לתהליך העבודה. בסיום תהליך העבודה, האשכול שנבחר לא נמחק.
הסלקטורים מציינים תוויות משתמש של Managed Service for Apache Spark אחת או יותר. אפשר להריץ משימות של זרימת עבודה באשכולות שנמצאים באותו אזור כמו זרימת העבודה, והתוויות שלהם תואמות לכל התוויות של הסלקטור. אם כמה אשכולות תואמים לסלקטור, Managed Service for Apache Spark יבחר את האשכול עם הכי הרבה זיכרון YARN פנוי.
הוספת בורר אשכולות לתבנית
אפשר להוסיף בורר אשכול לתבנית של תהליך עבודה באמצעות Google Cloud CLI או Dataproc API.
פקודת gcloud
gcloud dataproc workflow-templates set-cluster-selector template-id \ --region=region \ --cluster-labels=name=value[[,name=value]...]
API בארכיטקטורת REST
מידע נוסף זמין במאמר בנושא WorkflowTemplatePlacement.ClusterSelector. השדה הזה מסופק כחלק מ-WorkflowTemplate שהושלם ונשלח עם בקשת workflowTemplates.create או workflowTemplates.update.המסוף
אפשר לראות את תבניות זרימות העבודה הקיימות ואת זרימות העבודה שנוצרו בדף Workflows של Managed Service for Apache Spark במסוף Google Cloud .
שימוש בתוויות שמוחלות באופן אוטומטי
אפשר להפנות את הכלי לבחירת אשכולות לאשכול קיים באמצעות אחת מתוויות האשכולות שמוחלות אוטומטית הבאות:
goog-dataproc-cluster-namegoog-dataproc-cluster-uuid
לדוגמה:
gcloud dataproc workflow-templates set-cluster-selector template-id \ --region=region \ --cluster-labels=goog-dataproc-cluster-name=my-cluster
בחירה מתוך מאגר אשכולות
אתם יכולים לאפשר ל-Managed Service for Apache Spark לבחור אשכול מתוך מאגר של אשכולות. אפשר להגדיר את מאגרי האשכולות באמצעות תוויות.
לדוגמה:
gcloud dataproc clusters create cluster-1 --labels cluster-pool=pool-1 \ --region=region gcloud dataproc clusters create cluster-2 --labels cluster-pool=pool-1 \ --region=region gcloud dataproc clusters create cluster-3 --labels cluster-pool=pool-2 \ --region=region
אחרי יצירת האשכול ...
gcloud dataproc workflow-templates create my-template \ --region=region gcloud dataproc workflow-templates set-cluster-selector my-template \ --region=region \ --cluster-labels=cluster-pool=pool-1
תהליך העבודה יופעל באשכול 1 או באשכול 2, אבל לא באשכול 3.