Enterprise Knowledge Graph 概览

Enterprise Knowledge Graph 可将孤立的信息整理成组织知识,包括以高效且有用的方式对数据进行整合、标准化和调整。

Entity Reconciliation API

Entity Reconciliation API 是一种轻量级、由 AI 赋能的语义聚类和去重服务,适用于表格数据。它是一个独立 API,封装了 Google 核心实体解析引擎。它可以帮助客户协调和联接其数据,或将其数据与一个或多个第三方数据集联接。

主要功能包括:

  • 采用 Google 数据训练的先进预训练模型。
  • 内置实体丰富功能,包括地理编码。
  • Google 规模的聚类和协调功能,可处理包含数十亿个节点和数万亿条边的图。
  • 稳定的机器 ID (MID) 是每个实体集群的唯一标识符。
  • 原生支持最多 10 个 BigQuery 表。

工作方式

Enterprise Knowledge Graph 概念

在关系型数据库中,匹配主要通过严格管理的键(例如客户 ID)完成。有些支持模糊匹配,例如“Robert Smith”与“Bob Smith”。在图表中,匹配通过使用模糊文本、常见关系、实体类型及其属性的任意组合进行。当跨各种系统联接数据时,这种方法非常有效。

Entity Reconciliation API 会根据一组实体类型和映射到通用架构的文件,从源 BigQuery 表中读取数据。然后,它会执行知识提取 将输入的关系数据转换为 RDF 三元组,例如 知识图谱表示法。Google Entity Reconciliation 引擎随后会构建一个图,将实体聚类到不同的组中(同一组中的实体被视为匹配)。最后一步是以新的唯一标识符列 (MID) 的形式,将关联结果(匹配和不匹配)输出到客户指定的 BigQuery 表中。

Google Knowledge Graph Search API

在 Google 知识图谱中按关键字搜索或使用 ID 查找实体时,会使用 Google Knowledge Graph Search API。该 API 使用标准 schema.org 类型,并且符合 JSON-LD 规范。

您可以使用该 API 执行以下操作:

  • 对组织、产品、地点、图书、电影和许多其他实体执行实体解析。
  • 将您的私有实体关联到全局唯一的 Cloud 知识图谱机器 ID (MID)。
  • 获取与特定条件匹配的最知名实体的排名列表。
  • 使用 Google 知识图谱实体为内容添加注释并整理内容。
  • 通过 Google 知识图谱搜索 API 返回的其他 ID(例如 Google 地点 ID)连接到更广泛的数据生态系统。
  • 从其他 Google Cloud API(例如 Cloud Vision APICloud Natural Language APICloud Video Intelligence API)返回的 MID 中搜索实体

Google Knowledge Graph Search API 版本

Google Knowledge Graph Search API 提供两个版本:

  • Basic
  • Advanced

这两个版本都支持实体搜索和查找。它们还提供由 Google Cloud构建的相同基本知识图谱实体。企业版包含其他功能,例如关联到 Google 地点 ID 和更多数据覆盖范围。

如果您正在规划新项目,请使用 Cloud 知识图谱 高级版构建应用,以利用新功能和改进的服务。基本版仍然可用,但不提供新功能、高 QPS 或其他安全和合规性标准。

如需了解这两个版本之间的比较,请参阅比较基本版和高级版