Cloud Data Fusion 中的佈建者

佈建器負責建立及拆除執行管道的雲端叢集。不同的佈建工具可在各種雲端上建立不同類型的叢集。

每個佈建器都會公開一組設定,用於控管為執行作業建立的叢集類型。舉例來說,Managed Service for Apache Spark 和 Amazon EMR 佈建器都有叢集大小設定。供應商也具備與各自雲端通訊及佈建所需運算節點的憑證設定。

Cloud Data Fusion 支援的佈建者

Cloud Data Fusion 支援下列佈建器:

Managed Service for Apache Spark
運作快速又簡單易用的全代管雲端服務,可執行 Apache Spark 和 Apache Hadoop 叢集。
Amazon Elastic MapReduce (EMR)
提供代管的 Hadoop 架構,可跨動態擴充的 Amazon EC2 執行個體處理大量資料。
遠端 Hadoop
在現有的 Hadoop 叢集上執行工作,無論是地端部署或雲端環境皆可。