"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).
Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
发送反馈
Managed Service for Apache Spark 可选 Pig 组件
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
使用可选组件 功能创建 Managed Service for Apache Spark 集群时,您可以安装 Apache Pig 等其他组件。本页面介绍了 Pig 组件,这是一个用于分析大型数据集的开源平台。
安装组件
在创建 Managed Service for Apache Spark 集群时安装该组件。
Apache Pig 是 Managed Service for Apache Spark 2.3 及更高版本映像中的可选组件。
注意 : Apache Pig 会自动安装在 Managed Service for Apache Spark 2.2 及更低版本的映像上。
如需了解最新版 Managed Service for Apache Spark 映像版本中包含的组件版本,请参阅支持的 Managed Service for Apache Spark 版本 。
gcloud
如需创建包含 Pig 组件的 Managed Service for Apache Spark 集群,请将 gcloud dataproc clusters create CLUSTER_NAME 命令与 --optional-components 标志结合使用(使用映像版本 2.3 或更高版本)。
gcloud dataproc clusters create CLUSTER_NAME \
--region=REGION \
--optional-components=PIG \
--image-version=2.3 \
... other flags
控制台
启用组件:
在 Google Cloud 控制台中,打开 Managed Service for Apache Spark 创建集群 页面。选中“设置集群”面板。
在“组件”部分的“可选组件”下,选择 Pig 以及其他一些要在集群上安装的可选组件。
发送反馈
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可 获得了许可,并且代码示例已根据 Apache 2.0 许可 获得了许可。有关详情,请参阅 Google 开发者网站政策 。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2026-06-03。
需要向我们提供更多信息?
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2026-06-03。"],[],[]]