创建和管理数据集

在文件上传的上下文中,数据集是指具有相同结构的文件集合。在数据洞察中创建文件上传数据集后,您可以像处理其他类型的数据一样,连接到该数据集并创建使用该数据的数据源。

创建数据集

如需创建数据集,请创建新的“文件上传”数据源,然后向其中添加文件:

  1. 登录数据洞察
  2. 在 Looker 数据洞察首页的左上角,点击 “创建”图标。 创建,然后选择数据源
  3. 在“连接器”面板中选择文件上传
  4. 将一个或多个文件从您的计算机拖动到上传目标位置,或者点击上传文件,然后选择所需的文件。

您的文件将添加到数据集中。

处理您的文件可能需要一些时间。在此期间,您仍然可以添加更多数据或创建新数据集。

修改数据集

您可以通过以下两种方式修改数据集:修改基于数据集的数据源的连接,或通过连接器面板修改。

修改数据源连接

  1. 登录数据洞察。登录后,您会看到首页
  2. 点击数据源标签页。
  3. 点击使用要修改的数据集的数据源。
  4. 点击左上角的“修改连接”。

使用连接器面板

  1. 登录数据洞察。登录后,您会看到首页
  2. 点击数据源标签页。
  3. 点击 创建新报告或数据源。
  4. 在“连接器”面板中选择文件上传
  5. 点击要修改的数据集。

向数据集添加数据

您可以随时向数据集添加更多文件。修改数据集,然后点击添加文件。然后,选择要上传的一个或多个文件。无需点击“重新连接”。使用该数据集的任何数据源都将能够自动访问新数据。

删除上传的文件

删除上传文件会从数据集中移除相应数据。此操作无法撤消(不过,您可以根据需要再次上传相同的文件)。

  1. 修改数据集。
  2. 将鼠标悬停在要删除的文件上。
  3. 点击右侧显示的回收站图标。

重命名数据集

首次创建数据集时,系统会使用上传的第一个文件的名称来命名该数据集。如需重命名数据集,请执行以下操作:

  1. 修改要重命名的数据集。
  2. 点击文件面板中的当前名称,然后输入新名称。

删除数据集

删除数据集会永久移除所有已上传的文件。

  1. 修改要删除的数据集。
  2. 点击文件列表底部的删除数据集

修正上传错误

如果上传的文件存在错误,数据洞察会在文件列表的“状态”列中显示错误。点击“错误”即可显示发现的实际问题。几乎所有这些错误都是由于上传的文件中存在意外的格式。

详细了解上传文件格式

在新数据源中使用现有数据集

您可以在任意数量的数据源中重复使用数据集。

  1. 创建新的数据源。
  2. 连接器面板中选择文件上传
  3. 选择现有数据集。
  4. 点击右上角的关联

更改现有数据源的数据集

您可以将现有数据源连接到其他数据集。

  1. 修改数据源连接。
  2. 从数据集列表中选择一个新数据集,或创建一个新数据集。
  3. 点击重新连接

访问您在 Google Cloud Storage 中的数据

您通过数据洞察上传的所有数据都存储在 Google Cloud Storage 中。您可以在该位置访问所有已上传的数据,还可以将这些数据用于其他云服务。如需访问云端数据,请执行以下操作:

  1. 修改数据集。
  2. 点击查看云端文件