通过上传 CSV(逗号分隔值)文件,您几乎可以将任何来源的数据导入到数据洞察中。借助文件上传功能,您可以针对特定连接器不支持的数据生成报告。
文件上传的工作原理
上传文件时,您会将该文件添加到“数据集”。然后,您可以基于该数据集创建数据源。
您创建的数据集归您所有,无法共享;不过,您基于数据集创建的数据源可以像其他数据源一样共享和修改。这意味着,您的数据集可以在共享的数据源和报告中使用,但只有您可以访问数据集本身。
您可以将多个文件上传到数据集。添加新文件时,这些数据会附加到数据集。
您上传的数据存储在 Cloud Storage 中。这种存储方式有很多好处,包括能够从云端访问和下载数据,以及能够将数据用于其他 Google Cloud 服务。
创建 CSV 文件数据源
数据洞察会将上传的 CSV 文件存储在数据集中。一个数据集可以包含一个或多个具有相同列标题的 CSV 文件。一个 CSV 文件数据源可以包含一个或多个数据集。
如需创建新的 CSV 文件数据源,请按以下步骤操作:
- 登录数据洞察。
- 点击创建 按钮,然后选择数据源 。
- 选择 CSV 文件上传 Google 连接器。
- 点击添加数据集 按钮,创建一个新数据集。
- 您还可以将一个或多个 CSV 文件拖到可用数据集 部分,数据洞察会创建一个包含上传文件的新数据集。
- 上传完文件后,点击连接 按钮。
您上传的数据存储在 Cloud Storage 中。这种存储设置有很多好处,包括能够从云端访问和下载数据,以及能够将数据用于其他 Google Cloud 服务。
将 CSV 文件添加到数据集
只要列标题一致,您就可以将多个文件上传到数据集。添加新文件时,这些数据会附加到数据集。这样,您就可以随着时间的推移更新数据。
如需将 CSV 文件添加到数据集,请按以下步骤操作:
- 登录数据洞察。
- 点击数据源 标签页。
- 选择包含 CSV 文件的数据源。
- 点击修改连接 。
- 在可用数据集 部分,选择要从中添加文件的数据集。
- 点击添加文件 按钮。
- 您还可以将一个或多个 CSV 文件拖到数据集中的文件 部分。
- 上传完文件后,点击重新连接 按钮。
共享数据集
您创建的数据集归您所有,无法共享。不过,创建基于数据集的数据源后,您可以与其他用户共享该数据源。这意味着,您的数据集可以在共享的数据源和报告中使用,但只有您可以访问数据集本身。
上传文件格式
您应确保上传的文件格式正确。否则,上传过程中可能会出错,或者您的数据在报告中可能显示不正确。
内容错误最常见的原因可能是上传的数据中分隔符、引号和换行符使用不当。了解文件上传功能如何处理这些内容,可以避免日后出现问题。
UTF-8 编码
您的上传文件应采用 UTF-8 编码。这是网络上大多数应用的标准编码。
不过,如果您要从某些桌面产品(例如 Microsoft Excel)导出数据,可能需要先将文件转换为 UTF-8,然后再使用数据洞察上传。否则,数据洞察可能会返回错误消息,例如 Invalid characters in the file. Only UTF-8 encoded characters are supported.(文件中的字符无效。仅支持 UTF-8 编码的字符。)
仅限表格数据
文件上传功能只能导入表格数据文件。这意味着您的文件必须具有规则的行和列结构。即使表格中某个单元格缺少数据,每行也必须具有相同数量的列。如果尝试上传包含合并单元格或结构不一致的文件,上传会失败并显示错误。
分隔符
您数据中的所有字段都必须用英文逗号分隔。
如果您要上传的字段中的实际数据包含英文逗号,则必须用引号将该字段括起来。如果您的数据包含双引号,您可以使用单引号字符将该字段括起来。
标题行
文件中的第一行必须是标题行。此行将告知数据洞察如何命名您的字段。字段名称必须唯一,因此标题行中不能有重复的值。
列名称必须满足以下条件:
- 只能包含字母、数字或下划线。不允许使用其他标点符号或特殊字符。
- 以字母或下划线开头
- 长度不超过 128 个字符
标题行还必须遵循分隔符规则。
换行符
文件中的每一行都必须以换行符结尾。即使数据中的换行符用引号进行了转义,文件上传功能也不支持这些换行符。
问题排查
以下部分介绍了您在上传 CSV 文件时可能会看到的常见错误。
错误:文件无效
如果数据洞察在尝试上传 CSV 文件后显示错误 File is Invalid,请检查以下可能的原因:
- 文件包含无效的 UTF-8 字符。
- 文件实际上不是 CSV 文件。例如,如果您将 PDF 文件重命名为使用“.csv”扩展名,则数据洞察将无法正确解析该文件。
文件上传的限制
文件上传受以下限制:
- 每个用户 1,000 个数据集
- 每个用户 2 GB 的总存储空间
- 每个数据集每天 100 次上传
- 每个数据集的文件大小上限为 100 MB