Enterprise Knowledge Graph 可将孤立的信息整理成组织知识,包括以高效且有用的方式对数据进行整合、标准化和调整。
实体协调 API
Entity Reconciliation API 是一项轻量级、基于 AI 的语义聚类和重复数据删除服务,适用于表格数据。它是一个独立 API,封装了 Google 核心实体解析引擎。它可帮助客户协调和联接自己的数据,或将自己的数据与一个或多个第三方数据集联接起来。
Key features include:
- 使用 Google 数据训练的先进预训练模型。
- 内置实体扩充功能,包括地理编码。
- Google 规模的聚类和协调,可处理节点数高达数十亿、边数高达数万亿的图。
- 稳定机器 ID (MID) 是每个实体集群的唯一标识符。
- 原生支持最多 10 个 BigQuery 表。
工作方式

在关系型数据库中,匹配主要通过严格管理的键(例如客户 ID)来完成。有些支持模糊匹配,例如“Robert Smith”与“Bob Smith”。在图表中,匹配通过使用模糊文本、常见关系、实体类型及其属性的任意组合来实现。当需要联接各种不同系统中的数据时,这种方法非常有效。
Entity Reconciliation API 会读取源 BigQuery 表中的数据,前提是这些表具有一组实体类型和映射到通用架构的文件。然后,它会执行知识提取,将输入的关系数据转换为 RDF 三元组,例如知识图谱表示形式。然后,Google 实体调和引擎会构建一个图,将实体聚类到不同的组中(同一组中的实体被视为匹配)。最后一步是将关联结果(匹配和不匹配)以新的唯一标识符列 (MID) 的形式输出到客户指定的 BigQuery 表中。
Google Knowledge Graph Search API
通过关键字搜索或在 Google 知识图谱中使用 ID 查找实体时,会使用 Google Knowledge Graph Search API。该 API 使用标准 schema.org 类型,并符合 JSON-LD 规范。
使用该 API 可执行以下操作:
- 对组织、产品、地点、图书、电影和许多其他实体执行实体解析。
- 将您的私有实体与全球唯一的 Cloud Knowledge Graph 机器 ID (MID) 相关联。
- 获取符合特定条件的最受关注的实体的排名列表。
- 使用 Google 知识图谱实体为内容添加注释并整理内容。
- 通过 Google Knowledge Graph Search API 返回的其他 ID(例如 Google Place ID)连接到更广泛的数据生态系统。
- 搜索其他 Google Cloud API(例如 Cloud Vision API、Cloud Natural Language API 和 Cloud Video Intelligence API)返回的 MID 中的实体
Google Knowledge Graph Search API 版本
Google Knowledge Graph Search API 提供两个版本:
BasicAdvanced
这两个版本都支持实体搜索和查找。它们还提供由 Google Cloud构建的相同基础知识图谱实体。企业版包含其他功能,例如关联到 Google Place ID 和提供更多数据覆盖范围。
如果您正在规划新项目,请使用 Cloud Knowledge Graph 高级版构建应用,以利用新功能和改进的服务。 基本版仍然可用,但不支持新功能、高 QPS 或其他安全合规性标准。
如需了解这两种版本之间的比较,请参阅比较基本版和高级版。