预览数据

本页面介绍了如何在 Cloud Data Fusion Studio 中预览数据,以便您在部署和运行流水线之前调试错误。

如果您遇到错误,可以在流水线仍处于草稿模式时修复这些错误。

Cloud Data Fusion 会使用源数据集的前 100 行来生成预览。

预览模式下,Studio 页面会显示预览作业的状态和时长。您可以随时停止预览作业。您还可以在预览作业运行时监控日志事件。

控制台

  1. 检查每个来源、转换和接收器是否都没有错误。如需 验证它们,请在 Cloud Data Fusion Studio 页面上,前往 每个插件的节点,然后依次点击 属性 > 验证
  2. Studio 页面上查看流水线,然后点击预览 开关,将其切换到“开启”位置。运行时长日志选项 会显示在Studio页面画布的顶部。
  3. 可选:在运行预览作业之前,点击配置 以更新以下设置。

    1. 运行时实参:如需了解详情,请参阅 设置运行时实参
    2. 预览配置:更新要预览的行数。
    3. 高级选项:更新流水线和引擎配置。 如需了解详情,请参阅管理流水线配置
  4. 如需启动预览作业,请点击运行 。运行预览作业时,系统不会将任何数据写入接收器,但您可以在部署流水线时检查数据是否按预期读取和写入。

  5. 可选:运行预览作业后,如需查看数据在流水线中每个阶段的外观,请在流水线中处理数据的节点(例如来源、接收器和转换)上点击预览数据

  6. 预览完数据后,点击预览 开关,将其切换到“关闭”位置,以退出预览模式。

后续步骤