Cloud Data Fusion 中的配置程序

预配器负责创建和拆除执行流水线的云集群。不同的预配器能够在各种云上创建不同类型的集群。

每个预配器都会公开一组配置设置,用于控制为运行创建的集群类型。例如,Managed Service for Apache Spark 和 Amazon EMR 预配器具有集群大小设置。预配器还具有用于与各自的云通信并预配所需计算节点的凭据的设置。

Cloud Data Fusion 中支持的预配器

Cloud Data Fusion 支持以下预配器:

Managed Service for Apache Spark
一项快速、易用、全托管式云服务,用于运行 Apache Spark 和 Apache Hadoop 集群。
Amazon Elastic MapReduce (EMR)
提供一个代管式 Hadoop 框架,用于跨动态可伸缩的 Amazon EC2 实例处理大量数据。
远程 Hadoop
在预先存在的 Hadoop 集群(本地或云端)上运行作业。