מטא-נתונים של אשכול

‫Dataproc מגדיר ערכים מיוחדים של מטא-נתונים עבור המופעים שפועלים באשכול:

מפתח מטא-נתוניםערך
dataproc-bucketהשם של קטגוריית הביניים של האשכול
dataproc-regionהאזור של נקודת הקצה של האשכול
dataproc-worker-countמספר צמתי העובדים באשכול. הערך הוא 0 עבור אשכולות עם צומת יחיד.
dataproc-cluster-nameשם האשכול
dataproc-cluster-uuidמזהה ייחודי אוניברסלי (UUID) של האשכול
dataproc-roleהתפקיד של המופע, Master או Worker
dataproc-masterשם המארח של צומת הראשי הראשון. הערך הוא [CLUSTER_NAME]-m באשכול רגיל או באשכול עם צומת יחיד, או [CLUSTER_NAME]-m-0 באשכול עם זמינות גבוהה, כאשר [CLUSTER_NAME] הוא שם האשכול.
dataproc-master-additionalרשימה מופרדת בפסיקים של שמות מארחים לצמתים הראשיים הנוספים באשכול עם זמינות גבוהה, לדוגמה, [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2 באשכול עם 3 צמתים ראשיים.
SPARK_BQ_CONNECTOR_VERSION or SPARK_BQ_CONNECTOR_URLהגרסה או כתובת ה-URL שמפנה לגרסה של מחבר Spark BigQuery לשימוש באפליקציות Spark, למשל, 0.42.1 או gs://spark-lib/bigquery/spark-3.5-bigquery-0.42.1.jar. גרסת ברירת מחדל של מחבר Spark BigQuery מותקנת מראש באשכולות של Dataproc 2.1 ובגרסאות מאוחרות יותר של תמונות. מידע נוסף זמין במאמר בנושא שימוש במחבר Spark BigQuery.

אפשר להשתמש בערכים האלה כדי להתאים אישית את ההתנהגות של פעולות ההגדרה הראשונית.

אפשר להשתמש בדגל --metadata בפקודה gcloud dataproc clusters create כדי לספק מטא-נתונים משלכם:

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --metadata=name1=value1,name2=value2... \
    ... other flags ...