创建和管理数据集

在文件上传的上下文中,数据集是指具有相同结构的文件集合。一旦数据洞察中存在文件上传数据集,您就可以连接到该数据集并创建使用该数据的数据源,就像使用其他类型的数据一样。

创建数据集

如需创建数据集,请创建新的“文件上传”数据源,然后向其中添加文件:

  1. 登录数据洞察。
  2. 在数据洞察首页的左上角,点击 “创建”图标。 创建 ,然后选择数据源
  3. 在“连接器”面板中,选择文件上传
  4. 将一个或多个文件从您的计算机拖放到上传目标位置,或者点击上传文件 ,然后选择所需的文件。

您的文件将添加到数据集中。

处理文件可能需要一些时间。在此期间,您仍然可以添加更多数据或创建新的数据集。

修改数据集

您可以通过以下两种方式修改数据集:修改基于该数据集的数据源的连接,或者通过“连接器”面板进行修改。

修改数据源连接

  1. 登录数据洞察。 登录后,您会看到首页。
  2. 点击“数据源”标签页。
  3. 点击使用您要修改的数据集的数据源。
  4. 点击左上角的“修改连接”。

使用“连接器”面板

  1. 登录数据洞察。 登录后,您会看到首页。
  2. 点击“数据源”标签页。
  3. 点击 创建新报告或数据源。
  4. 在“连接器”面板中,选择文件上传
  5. 点击要修改的数据集。

向数据集添加数据

您可以随时向数据集添加更多文件。修改数据集,然后点击添加文件 。接下来,选择一个或多个要上传的文件。无需点击“重新连接”。使用该数据集的任何数据源都将能够自动访问新数据。

删除上传的文件

删除上传的文件会从数据集中移除其数据。您无法撤消此操作(不过,如果需要,您可以再次上传相同的文件)。

  1. 修改数据集。
  2. 将鼠标悬停在要删除的文件上。
  3. 点击右侧显示的回收站图标。

重命名数据集

首次创建数据集时,系统会使用第一个上传文件的名称来命名该数据集。如需重命名数据集,请执行以下操作:

  1. 修改要重命名的数据集。
  2. 点击文件面板中的当前名称,然后输入新名称。

删除数据集

删除数据集会永久移除所有上传的文件。

  1. 修改要删除的数据集。
  2. 点击文件列表底部的删除数据集

修复上传错误

如果上传的文件有错误,数据洞察会在文件列表的“状态”列中显示错误。点击“错误”即可显示实际发现的问题。几乎所有这些错误都是由于上传的文件中存在意外的格式。

详细了解上传文件格式

在新数据源中使用现有数据集

您可以在任意数量的数据源中重复使用数据集。

  1. 创建新数据源。
  2. 在“连接器”面板中,选择文件上传
  3. 选择现有数据集。
  4. 点击右上角的连接

更改现有数据源的数据集

您可以将现有数据源连接到其他数据集。

  1. 修改数据源连接。
  2. 从数据集列表中选择新数据集,或创建新数据集。
  3. 点击重新连接

在 Google Cloud Storage 中访问您的数据

您通过数据洞察上传的所有数据都存储在 Google Cloud Storage 中。您可以在其中访问所有上传的数据,还可以将这些数据与其他云服务搭配使用。如需在云端访问您的数据,请执行以下操作:

  1. 修改数据集。
  2. 点击在云端查看文件