在 Knowledge Catalog 中查看数据关系

Knowledge Catalog(以前称为 Dataplex Universal Catalog)可发现数据资产之间的潜在关联,帮助您发现相关数据并了解关系的性质。

准备工作

在查看数据资产之间的关系之前,请确保您已获得所需的角色。

所需的角色

如需在 Knowledge Catalog 中查看数据资产之间的关系,您无需任何特定于 Knowledge Catalog 的 IAM 角色。 Knowledge Catalog 会使用您在资产所在的源系统(例如 BigQuery)中的现有权限来确定您查看关系的能力。例如,如需查看涉及 BigQuery 表的关系,您需要拥有 bigquery.tables.get 权限。

如果您无权查看来源系统中的某个资产,则 Knowledge Catalog 关系图会隐藏涉及该资产的所有关系。这样可确保关系可见性符合源系统中建立的安全边界和权限。

数据关系简介

数据关系可直观呈现数据资产之间的关联。例如,如果您找到包含客户数据的表,其关系可以显示列出订单或支持服务工单的相关表。此外,关系还充当结构指南,为大语言模型提供必要的上下文。因此,AI 可以生成更精确的回答,并制定准确的查询来检索特定信息。

Knowledge Catalog 会自动发现并存储数据资产之间的常见关系。关系数据源自各种来源,例如:

  • 历史查询日志 Knowledge Catalog,可不断分析查询历史记录,以检测表格之间潜在的 JOIN 模式。
  • 数据洞见通过使用大语言模型分析架构属性和数据重叠情况,按需建议数据关系。

支持的数据资产

您可以查看 BigQuery 表和视图的数据关系。

查看数据关系

如需查看 BigQuery 表和视图的数据关系,请使用Google Cloud 控制台或 Dataplex API。

控制台

如需查看 BigQuery 中某个表的数据关系,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往 Knowledge Catalog 搜索页面。

    转到搜索

  2. 搜索要查看关系的 BigQuery 表。

  3. 在搜索结果中,点击相应表格以打开其条目页面。

关系标签页会列出关系以及以下信息:

  • 目标:已连接的数据资产的名称。
  • 关系:用于关联资产的特定列。
  • 类型:链接的性质。例如 JOIN
  • 来源:关系的来源。例如,查询历史记录。
  • 操作:可用于发现资产之间关联的示例查询。

REST

发现的关系会以 EntryLinks 的形式存储在 Knowledge Catalog 中,用于在 Knowledge Catalog 中建立两个数据资产(条目)之间的关系。有关关系的详细信息(例如联接的列和关系来源)存储为 EntryLinks 的方面。

如需查看数据关系,请使用以下方法:

  • LookupEntryLinks 会检索将特定数据条目作为来源或目标的所有 EntryLinks,以返回与给定条目关联的完整关系集。

  • LookupContext 提供单个端点,用于通过上下文元数据为 AI 代理提供依据。 它会返回一个简明且预先格式化的元数据软件包,其中包括相关的数据资产。

位置

您可以在所有 BigQuery 位置使用数据关系。

限制

  • 从查询日志中自动发现关系的功能仅适用于 BigQuery 表和视图。
  • Knowledge Catalog 会分析部分搜索查询历史记录来识别关系,这意味着某些搜索查询可能无法发现链接。
  • 在执行查询后,关系发现可能需要长达 48 小时。

后续步骤