此页面由 Cloud Translation API 翻译。

插件概览

在 Cloud Data Fusion 中创建数据流水线时，您可以使用一系列阶段（称为节点）来移动和管理从来源流向接收器的数据。每个节点都包含一个插件，该插件是一个可自定义的模块，可用于扩展 Cloud Data Fusion 的功能。

您可以在 Cloud Data Fusion 网页界面中找到这些插件，只需前往 Studio 页面即可。如需了解更多插件，请点击 Hub。

网页界面中的插件。

插件类型

插件分为以下几类：

来源插件可连接到数据库、文件或实时流，您的流水线可从中读取数据。您可以使用网页界面为数据流水线设置来源，因此无需费心编写低层级中的连接代码。

转换插件会在从来源提取数据后更改数据。例如，您可以克隆记录、将文件格式更改为 JSON，或使用 JavaScript 插件创建自定义转换。

分析插件可执行聚合，例如联接来自不同来源的数据，以及运行分析和机器学习操作。

接收器插件将数据写入 Cloud Storage、BigQuery、Spanner、关系型数据库、文件系统和大型机等资源。您可以使用 Cloud Data Fusion 网页界面或 REST API 查询写入接收器的相关数据。

使用条件和操作插件来安排在工作流期间执行的操作，这些操作不会直接操纵工作流中的数据。例如：

当阶段遇到 null 值、逻辑错误或其他错误来源时，您可以使用错误处理程序插件来捕获错误。使用这些插件可在转换或分析插件之后查找输出中的错误。您可以将错误写入数据库以供分析。