מטא-נתונים של אשכול

‫Managed Service for Apache Spark מגדיר ערכים מיוחדים של מטא-נתונים למופעים שפועלים באשכול:

מפתח מטא-נתוניםערך
dataproc-bucketהשם של קטגוריית הביניים של האשכול
dataproc-regionהאזור של נקודת הקצה של האשכול
dataproc-worker-countמספר צמתי העובדים באשכול. הערך הוא 0 עבור אשכולות עם צומת יחיד.
dataproc-cluster-nameשם האשכול
dataproc-cluster-uuidמזהה ייחודי אוניברסלי (UUID) של האשכול
dataproc-roleהתפקיד של המופע, Master או Worker
dataproc-masterשם המארח של צומת הראשי הראשון. הערך הוא [CLUSTER_NAME]-m באשכול רגיל או באשכול עם צומת יחיד, או [CLUSTER_NAME]-m-0 באשכול עם זמינות גבוהה, כאשר [CLUSTER_NAME] הוא שם האשכול.
dataproc-master-additionalרשימה מופרדת בפסיקים של שמות מארחים לצמתים הראשיים הנוספים באשכול זמינות גבוהה, לדוגמה, [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2 באשכול שיש בו 3 צמתים ראשיים.
SPARK_BQ_CONNECTOR_VERSION or SPARK_BQ_CONNECTOR_URLהגרסה או כתובת ה-URL שמפנה לגרסה של מחבר Spark BigQuery לשימוש באפליקציות Spark, למשל, 0.42.1 או gs://spark-lib/bigquery/spark-3.5-bigquery-0.42.1.jar. גרסת ברירת מחדל של מחבר Spark BigQuery מותקנת מראש באשכולות של Managed Service for Apache Spark 2.1 ובגרסאות מאוחרות יותר של תמונות. מידע נוסף זמין במאמר בנושא שימוש במחבר Spark BigQuery.

אפשר להשתמש בערכים האלה כדי להתאים אישית את ההתנהגות של פעולות ההפעלה.

אפשר להשתמש בדגל --metadata בפקודה gcloud dataproc clusters create כדי לספק מטא-נתונים משלכם:

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --metadata=name1=value1,name2=value2... \
    ... other flags ...