שימוש בסלקטורים של אשכולות בתהליכי עבודה

במקום להפעיל תהליך עבודה באשכול מנוהל, אפשר להשתמש בכלי לבחירת אשכול כדי לבחור אשכול קיים לתהליך העבודה. בסיום תהליך העבודה, האשכול שנבחר לא נמחק.

הסלקטורים מציינים תוויות משתמש של Managed Service for Apache Spark אחת או יותר. אפשר להריץ משימות של זרימת עבודה באשכולות שנמצאים באותו אזור כמו זרימת העבודה, והתוויות שלהם תואמות לכל התוויות של הסלקטור. אם כמה אשכולות תואמים לסלקטור, Managed Service for Apache Spark יבחר את האשכול עם הכי הרבה זיכרון YARN פנוי.

הוספת בורר אשכולות לתבנית

אפשר להוסיף בורר אשכול לתבנית של תהליך עבודה באמצעות Google Cloud CLI או Dataproc API.

פקודת gcloud

gcloud dataproc workflow-templates set-cluster-selector template-id \
    --region=region \
    --cluster-labels=name=value[[,name=value]...]

‫API בארכיטקטורת REST

מידע נוסף זמין במאמר בנושא WorkflowTemplatePlacement.ClusterSelector. השדה הזה מסופק כחלק מ-WorkflowTemplate שהושלם ונשלח עם בקשת workflowTemplates.create או workflowTemplates.update.

המסוף

אפשר לראות את תבניות זרימות העבודה הקיימות ואת זרימות העבודה שנוצרו בדף Workflows של Managed Service for Apache Spark במסוף Google Cloud .

שימוש בתוויות שמוחלות באופן אוטומטי

אפשר להפנות את הכלי לבחירת אשכולות לאשכול קיים באמצעות אחת מתוויות האשכולות שמוחלות אוטומטית הבאות:

  • goog-dataproc-cluster-name
  • goog-dataproc-cluster-uuid

לדוגמה:

gcloud dataproc workflow-templates set-cluster-selector template-id \
    --region=region \
    --cluster-labels=goog-dataproc-cluster-name=my-cluster

בחירה מתוך מאגר אשכולות

אתם יכולים לאפשר ל-Managed Service for Apache Spark לבחור אשכול מתוך מאגר של אשכולות. אפשר להגדיר את מאגרי האשכולות באמצעות תוויות.

לדוגמה:

gcloud dataproc clusters create cluster-1 --labels cluster-pool=pool-1 \
    --region=region
gcloud dataproc clusters create cluster-2 --labels cluster-pool=pool-1 \
    --region=region
gcloud dataproc clusters create cluster-3 --labels cluster-pool=pool-2 \
    --region=region

אחרי יצירת האשכול ...

gcloud dataproc workflow-templates create my-template \
    --region=region
gcloud dataproc workflow-templates set-cluster-selector my-template \
    --region=region \
    --cluster-labels=cluster-pool=pool-1

תהליך העבודה יופעל באשכול 1 או באשכול 2, אבל לא באשכול 3.