在文件上传的上下文中,数据集是指具有相同结构的文件集合。一旦数据洞察中存在文件上传数据集,您就可以连接到该数据集并创建使用该数据的数据源,就像使用其他类型的数据一样。
创建数据集
如需创建数据集,请创建新的“文件上传”数据源,然后向其中添加文件:
- 登录数据洞察。
- 在数据洞察首页的左上角,点击
创建 ,然后选择数据源 。 - 在“连接器”面板中,选择文件上传 。
- 将一个或多个文件从您的计算机拖放到上传目标位置,或者点击上传文件 ,然后选择所需的文件。
您的文件将添加到数据集中。
处理文件可能需要一些时间。在此期间,您仍然可以添加更多数据或创建新的数据集。
修改数据集
您可以通过以下两种方式修改数据集:修改基于该数据集的数据源的连接,或者通过“连接器”面板进行修改。
修改数据源连接
使用“连接器”面板
向数据集添加数据
您可以随时向数据集添加更多文件。修改数据集,然后点击添加文件 。接下来,选择一个或多个要上传的文件。无需点击“重新连接”。使用该数据集的任何数据源都将能够自动访问新数据。
删除上传的文件
删除上传的文件会从数据集中移除其数据。您无法撤消此操作(不过,如果需要,您可以再次上传相同的文件)。
- 修改数据集。
- 将鼠标悬停在要删除的文件上。
- 点击右侧显示的回收站图标。
重命名数据集
首次创建数据集时,系统会使用第一个上传文件的名称来命名该数据集。如需重命名数据集,请执行以下操作:
- 修改要重命名的数据集。
- 点击文件面板中的当前名称,然后输入新名称。
删除数据集
删除数据集会永久移除所有上传的文件。
- 修改要删除的数据集。
- 点击文件列表底部的删除数据集 。
修复上传错误
如果上传的文件有错误,数据洞察会在文件列表的“状态”列中显示错误。点击“错误”即可显示实际发现的问题。几乎所有这些错误都是由于上传的文件中存在意外的格式。
详细了解上传文件格式。
在新数据源中使用现有数据集
您可以在任意数量的数据源中重复使用数据集。
- 创建新数据源。
- 在“连接器”面板中,选择文件上传 。
- 选择现有数据集。
- 点击右上角的连接 。
更改现有数据源的数据集
您可以将现有数据源连接到其他数据集。
- 修改数据源连接。
- 从数据集列表中选择新数据集,或创建新数据集。
- 点击重新连接 。
在 Google Cloud Storage 中访问您的数据
您通过数据洞察上传的所有数据都存储在 Google Cloud Storage 中。您可以在其中访问所有上传的数据,还可以将这些数据与其他云服务搭配使用。如需在云端访问您的数据,请执行以下操作:
- 修改数据集。
- 点击在云端查看文件 。