Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cloud Data Fusion 中的配置程序

预配器负责创建和拆除执行流水线的云集群。不同的预配器能够在各种云上创建不同类型的集群。

每个预配器都会公开一组配置设置，用于控制为运行创建的集群类型。例如，Managed Service for Apache Spark 和 Amazon EMR 预配器具有集群大小设置。预配器还具有用于与各自的云通信并预配所需计算节点的凭据的设置。

Cloud Data Fusion 中支持的预配器

Cloud Data Fusion 支持以下预配器：

Managed Service for Apache Spark: 一项快速、易用、全托管式云服务，用于运行 Apache Spark 和 Apache Hadoop 集群。
Amazon Elastic MapReduce (EMR): 提供一个代管式 Hadoop 框架，用于跨动态可伸缩的 Amazon EC2 实例处理大量数据。
远程 Hadoop: 在预先存在的 Hadoop 集群（本地或云端）上运行作业。

如未另行说明，那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可，并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情，请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。

最后更新时间 (UTC)：2026-05-30。