将 CSV 文件上传到数据洞察

通过上传 CSV(逗号分隔值)文件,您几乎可以将任何来源的数据导入到数据洞察中。借助文件上传功能,您可以针对特定连接器不支持的数据生成报告。

文件上传的工作原理

上传文件时,您会将该文件添加到“数据集”。然后,您可以基于该数据集创建数据源。

您创建的数据集归您所有,无法共享;不过,您基于数据集创建的数据源可以像其他数据源一样共享和修改。这意味着,您的数据集可以在共享的数据源和报告中使用,但只有您可以访问数据集本身。

您可以将多个文件上传到数据集。添加新文件时,这些数据会附加到数据集。

您上传的数据存储在 Cloud Storage 中。这种存储方式有很多好处,包括能够从云端访问和下载数据,以及能够将数据用于其他 Google Cloud 服务。

详细了解 Cloud Storage

创建 CSV 文件数据源

数据洞察会将上传的 CSV 文件存储在数据集中。一个数据集可以包含一个或多个具有相同列标题的 CSV 文件。一个 CSV 文件数据源可以包含一个或多个数据集。

如需创建新的 CSV 文件数据源,请按以下步骤操作:

  1. 登录数据洞察。
  2. 点击创建 按钮,然后选择数据源
  3. 选择 CSV 文件上传 Google 连接器。
  4. 点击添加数据集 按钮,创建一个新数据集。
    • 您还可以将一个或多个 CSV 文件拖到可用数据集 部分,数据洞察会创建一个包含上传文件的新数据集。
  5. 上传完文件后,点击连接 按钮。

您上传的数据存储在 Cloud Storage 中。这种存储设置有很多好处,包括能够从云端访问和下载数据,以及能够将数据用于其他 Google Cloud 服务。

详细了解 Cloud Storage

将 CSV 文件添加到数据集

只要列标题一致,您就可以将多个文件上传到数据集。添加新文件时,这些数据会附加到数据集。这样,您就可以随着时间的推移更新数据。

如需将 CSV 文件添加到数据集,请按以下步骤操作:

  1. 登录数据洞察。
  2. 点击数据源 标签页。
  3. 选择包含 CSV 文件的数据源。
  4. 点击修改连接
  5. 可用数据集 部分,选择要从中添加文件的数据集。
  6. 点击添加文件 按钮。
    • 您还可以将一个或多个 CSV 文件拖到数据集中的文件 部分。
  7. 上传完文件后,点击重新连接 按钮。

共享数据集

您创建的数据集归您所有,无法共享。不过,创建基于数据集的数据源后,您可以与其他用户共享该数据源。这意味着,您的数据集可以在共享的数据源和报告中使用,但只有您可以访问数据集本身。

上传文件格式

您应确保上传的文件格式正确。否则,上传过程中可能会出错,或者您的数据在报告中可能显示不正确。

内容错误最常见的原因可能是上传的数据中分隔符、引号和换行符使用不当。了解文件上传功能如何处理这些内容,可以避免日后出现问题。

UTF-8 编码

您的上传文件应采用 UTF-8 编码。这是网络上大多数应用的标准编码。

不过,如果您要从某些桌面产品(例如 Microsoft Excel)导出数据,可能需要先将文件转换为 UTF-8,然后再使用数据洞察上传。否则,数据洞察可能会返回错误消息,例如 Invalid characters in the file. Only UTF-8 encoded characters are supported.(文件中的字符无效。仅支持 UTF-8 编码的字符。)

仅限表格数据

文件上传功能只能导入表格数据文件。这意味着您的文件必须具有规则的行和列结构。即使表格中某个单元格缺少数据,每行也必须具有相同数量的列。如果尝试上传包含合并单元格或结构不一致的文件,上传会失败并显示错误。

分隔符

您数据中的所有字段都必须用英文逗号分隔。

如果您要上传的字段中的实际数据包含英文逗号,则必须用引号将该字段括起来。如果您的数据包含双引号,您可以使用单引号字符将该字段括起来。

标题行

文件中的第一行必须是标题行。此行将告知数据洞察如何命名您的字段。字段名称必须唯一,因此标题行中不能有重复的值。

列名称必须满足以下条件:

  • 只能包含字母、数字或下划线。不允许使用其他标点符号或特殊字符。
  • 以字母或下划线开头
  • 长度不超过 128 个字符

标题行还必须遵循分隔符规则

换行符

文件中的每一行都必须以换行符结尾。即使数据中的换行符用引号进行了转义,文件上传功能也不支持这些换行符。

问题排查

以下部分介绍了您在上传 CSV 文件时可能会看到的常见错误。

错误:文件无效

如果数据洞察在尝试上传 CSV 文件后显示错误 File is Invalid,请检查以下可能的原因:

  • 文件包含无效的 UTF-8 字符
  • 文件实际上不是 CSV 文件。例如,如果您将 PDF 文件重命名为使用“.csv”扩展名,则数据洞察将无法正确解析该文件。

文件上传的限制

文件上传受以下限制:

  • 每个用户 1,000 个数据集
  • 每个用户 2 GB 的总存储空间
  • 每个数据集每天 100 次上传
  • 每个数据集的文件大小上限为 100 MB

关于数据源