"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).
Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
发送反馈
集群元数据
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
元数据与标签的比较
自定义元数据可供集群上运行的流程使用,并可供初始化操作使用。
标签尚不适用于在集群上运行的流程,但可用于通过 Dataproc API 搜索资源。
如果您需要向集群提供一段数据,并将这段数据用作 API 搜索参数,请将其作为元数据和标签添加到集群中。
Managed Service for Apache Spark 会为集群中运行的实例设置特殊元数据值:
元数据键 值
dataproc-bucket集群的暂存存储分区 的名称
dataproc-region集群端点所在的区域
dataproc-worker-count集群中的工作器节点数。对于单节点集群 ,值为 0。
dataproc-cluster-name集群的名称
dataproc-cluster-uuid集群的 UUID
dataproc-role实例的角色(Master 或 Worker)
dataproc-master第一个主节点的主机名。该值为 [CLUSTER_NAME]-m(在标准或单个节点集群中)或 [CLUSTER_NAME]-m-0(在高可用性集群 中),其中 [CLUSTER_NAME] 是您的集群名称。
dataproc-master-additional高可用性集群中其他主节点的主机名列表(用英文逗号分隔),例如具有 3 个主节点的集群中的 [CLUSTER_NAME]-m-1,[CLUSTER_NAME]-m-2。
SPARK_BQ_CONNECTOR_VERSION or SPARK_BQ_CONNECTOR_URL指向 Spark 应用中要使用的 Spark BigQuery 连接器版本的版本或网址,例如 0.42.1 或 gs://spark-lib/bigquery/spark-3.5-bigquery-0.42.1.jar。默认的 Spark BigQuery 连接器版本已预安装在 Managed Service for Apache Spark 2.1 及更高版本的映像版本集群中。如需了解详情,请参阅使用 Spark BigQuery 连接器 。
您可以使用这些值来自定义初始化操作 的行为。
您可以使用 gcloud dataproc clusters create 命令中的 --metadata 标志来提供自己的元数据:
gcloud dataproc clusters create CLUSTER_NAME \
--region=REGION \
--metadata=name1=value1,name2=value2... \
... other flags ...
发送反馈
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可 获得了许可,并且代码示例已根据 Apache 2.0 许可 获得了许可。有关详情,请参阅 Google 开发者网站政策 。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2026-06-03。
需要向我们提供更多信息?
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2026-06-03。"],[],[]]