"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).
Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
提供意見
叢集中繼資料
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
中繼資料與標籤比較
自訂中繼資料可供叢集上執行的程序運用,也可供初始化動作使用。
標籤無法直接提供給叢集上執行的程序,但可用於透過 Dataproc API 搜尋資源。
如果需要讓叢集存取某項資料,並將該資料做為 API 搜尋參數,請同時將該資料新增為叢集中繼資料和標籤。
Managed Service for Apache Spark 會為叢集中執行的例項設定特殊中繼資料值:
中繼資料鍵 值
dataproc-bucket叢集暫存值區 名稱
dataproc-region叢集端點所在的區域
dataproc-worker-count叢集的 worker 節點數。值 0 表示單一節點叢集 。
dataproc-cluster-name叢集名稱
dataproc-cluster-uuid叢集的 UUID
dataproc-role執行個體的角色:Master 或 Worker
dataproc-master第一個主要節點的主機名稱。在標準或單一節點叢集中,值為 [CLUSTER_NAME]-m;在高可用性叢集 中則為 [CLUSTER_NAME]-m-0,當中的 [CLUSTER_NAME] 是叢集名稱。
dataproc-master-additional高可用性叢集中,其他主要節點的主機名稱清單 (以半形逗號分隔)。舉例來說,在有 3 個主要節點的叢集中,清單會是 [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2。
SPARK_BQ_CONNECTOR_VERSION or SPARK_BQ_CONNECTOR_URL指向 Spark 應用程式所用 Spark BigQuery 連接器版本的版本或網址,例如 0.42.1 或 gs://spark-lib/bigquery/spark-3.5-bigquery-0.42.1.jar。映像檔版本為 Managed Service for Apache Spark 2.1 以上的叢集,會預先安裝預設 Spark BigQuery 連接器版本。詳情請參閱「使用 Spark BigQuery 連接器 」。
您可以使用這些值自訂初始化動作 的行為。
在 gcloud dataproc clusters create 指令中使用 --metadata 旗標,即可提供自己的中繼資料:
gcloud dataproc clusters create CLUSTER_NAME \
--region=REGION \
--metadata=name1=value1,name2=value2... \
... other flags ...
提供意見
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權 ,程式碼範例則為阿帕契 2.0 授權 。詳情請參閱《Google Developers 網站政策 》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2026-06-03 (世界標準時間)。
想進一步說明嗎?
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2026-06-03 (世界標準時間)。"],[],[]]