"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

创建 Managed Service for Apache Spark 零规模集群

本文档介绍了如何创建 Managed Service for Apache Spark 零规模集群。

Managed Service for Apache Spark 零规模集群提供了一种经济实惠的方式来使用 Managed Service for Apache Spark 集群。与至少需要两个主要工作器的标准 Managed Service for Apache Spark 集群不同，Managed Service for Apache Spark 零规模集群仅使用辅助工作器，这些工作器可以缩减至零。

Managed Service for Apache Spark 零规模集群非常适合用作长时间运行且会经历空闲期的集群，例如托管 Jupiter 笔记本的集群。它们通过使用零规模自动扩缩政策来提高资源利用率。

特征和限制

Managed Service for Apache Spark 零规模集群与标准集群有相似之处，但具有以下独特特征和限制：

需要使用映像版本 2.2.53 或更高版本。
仅支持辅助工作器，不支持主要工作器。
包含 YARN 等服务，但不支持 HDFS 文件系统。
- 如需将 Cloud Storage 用作默认文件系统，请将 core:fs.defaultFS 集群属性设置为 Cloud Storage 存储桶位置 (gs://BUCKET_NAME)。
- 如果您在创建集群期间停用了某个组件，也请停用 HDFS。
无法转换为标准集群或从标准集群转换而来。
需要为 ZERO_SCALE 集群类型设置自动扩缩政策。
需要选择灵活虚拟机作为机器类型。
不支持 Oozie 组件。
无法通过 Google Cloud 控制台创建。

可选：配置自动扩缩政策

您可以配置自动扩缩政策，以定义零规模集群的辅助工作器扩缩。执行此操作时，请注意以下事项：

将集群类型设置为 ZERO_SCALE。
仅为辅助工作器配置设置自动扩缩政策。

如需了解详情，请参阅创建自动扩缩政策。