Enterprise Knowledge Graph 概览

Enterprise Knowledge Graph 可将孤立的信息整理成组织知识,包括以高效且有用的方式对数据进行整合、标准化和调整。

实体协调 API

Entity Reconciliation API 是一项轻量级、基于 AI 的语义聚类和重复数据删除服务,适用于表格数据。它是一个独立 API,封装了 Google 核心实体解析引擎。它可帮助客户协调和联接自己的数据,或将自己的数据与一个或多个第三方数据集联接起来。

Key features include:

  • 使用 Google 数据训练的先进预训练模型。
  • 内置实体扩充功能,包括地理编码。
  • Google 规模的聚类和协调,可处理节点数高达数十亿、边数高达数万亿的图。
  • 稳定机器 ID (MID) 是每个实体集群的唯一标识符。
  • 原生支持最多 10 个 BigQuery 表。

工作方式

Enterprise Knowledge Graph 概念

在关系型数据库中,匹配主要通过严格管理的键(例如客户 ID)来完成。有些支持模糊匹配,例如“Robert Smith”与“Bob Smith”。在图表中,匹配通过使用模糊文本、常见关系、实体类型及其属性的任意组合来实现。当需要联接各种不同系统中的数据时,这种方法非常有效。

Entity Reconciliation API 会读取源 BigQuery 表中的数据,前提是这些表具有一组实体类型和映射到通用架构的文件。然后,它会执行知识提取,将输入的关系数据转换为 RDF 三元组,例如知识图谱表示形式。然后,Google 实体调和引擎会构建一个图,将实体聚类到不同的组中(同一组中的实体被视为匹配)。最后一步是将关联结果(匹配和不匹配)以新的唯一标识符列 (MID) 的形式输出到客户指定的 BigQuery 表中。

Google Knowledge Graph Search API

通过关键字搜索或在 Google 知识图谱中使用 ID 查找实体时,会使用 Google Knowledge Graph Search API。该 API 使用标准 schema.org 类型,并符合 JSON-LD 规范。

使用该 API 可执行以下操作:

  • 对组织、产品、地点、图书、电影和许多其他实体执行实体解析。
  • 将您的私有实体与全球唯一的 Cloud Knowledge Graph 机器 ID (MID) 相关联。
  • 获取符合特定条件的最受关注的实体的排名列表。
  • 使用 Google 知识图谱实体为内容添加注释并整理内容。
  • 通过 Google Knowledge Graph Search API 返回的其他 ID(例如 Google Place ID)连接到更广泛的数据生态系统。
  • 搜索其他 Google Cloud API(例如 Cloud Vision APICloud Natural Language APICloud Video Intelligence API)返回的 MID 中的实体

Google Knowledge Graph Search API 版本

Google Knowledge Graph Search API 提供两个版本:

  • Basic
  • Advanced

这两个版本都支持实体搜索和查找。它们还提供由 Google Cloud构建的相同基础知识图谱实体。企业版包含其他功能,例如关联到 Google Place ID 和提供更多数据覆盖范围。

如果您正在规划新项目,请使用 Cloud Knowledge Graph 高级版构建应用,以利用新功能和改进的服务。 基本版仍然可用,但不支持新功能、高 QPS 或其他安全合规性标准。

如需了解这两种版本之间的比较,请参阅比较基本版和高级版