Enterprise Knowledge Graph 總覽

Enterprise Knowledge Graph 會將資訊孤島整理成機構知識,以有效率且實用的方式整合、標準化及協調資料。

Entity Reconciliation API

Entity Reconciliation API 是一項輕量型服務,可運用 AI 技術對表格資料進行語意叢集和重複資料刪除作業。這項獨立 API 會包裝 Google 核心實體解析引擎。協助顧客比對及合併資料,或將資料與一或多個第三方資料集合併。

Key features include:

  • 使用 Google 資料訓練的預先訓練模型,品質最先進。
  • 內建實體擴充功能,包括地理編碼。
  • Google 規模的叢集和調解功能,可處理節點多達數十億個、邊緣多達數兆個的圖表。
  • 穩定機器 ID (MID) 是每個實體叢集的專屬 ID。
  • 最多可直接支援 10 個 BigQuery 資料表。

運作方式

Enterprise Knowledge Graph 概念

在關聯式資料庫中,比對作業主要透過嚴格管理的鍵 (例如客戶 ID) 進行。部分支援模糊比對,例如「Robert Smith」與「Bob Smith」。在圖表中,系統會使用模糊文字、常見關係、實體類型及其屬性的任意組合進行比對。如果要在異質系統組合中合併資料,這個方法非常實用。

Entity Reconciliation API 會讀取來源 BigQuery 資料表中的資料,並提供一組實體型別和對應至通用結構定義的檔案。接著執行知識擷取作業,將輸入的關聯資料轉換為 RDF 三元組,例如知識圖譜表示法。Google 實體比對引擎接著會建構圖表,將實體分組 (同一組中的實體視為相符)。最後一個步驟是將連結結果 (相符和不相符) 輸出至客戶指定的 BigQuery 資料表,並以新的專屬 ID 資料欄 (MID) 的形式呈現。

Google Knowledge Graph Search API

透過關鍵字搜尋或使用 ID 查詢 Google 知識圖譜中的實體時,系統會使用 Google Knowledge Graph Search API。這個 API 使用標準 schema.org 型別,並符合 JSON-LD 規格。

使用 API 執行下列操作:

  • 對機構、產品、地點、書籍、電影和更多實體執行實體解析。
  • 將私有實體連結至全球唯一的 Cloud Knowledge Graph 機器 ID (MID)。
  • 取得符合特定條件的顯著實體排名清單。
  • 使用 Google 知識圖譜實體為內容加上註解並加以整理。
  • 透過 Google 知識圖譜搜尋 API 傳回的其他 ID (例如 Google 地點 ID),連結至更廣泛的資料生態系統。
  • 從其他 API (例如 Cloud Vision APICloud Natural Language APICloud Video Intelligence API) 傳回的 MID 搜尋實體 Google Cloud

Google Knowledge Graph Search API 版本

Google Knowledge Graph Search API 提供兩種版本:

  • Basic
  • Advanced

這兩個版本都支援實體搜尋和查詢。此外,這些模型也提供 Google Cloud建構的相同基礎知識圖譜實體。Enterprise 版提供多項額外功能,例如連結至 Google 地點 ID,以及涵蓋更多資料。

如果您正在規劃新專案,請使用 Cloud Knowledge Graph Advanced 版建構應用程式,才能利用新功能與改善的服務項目。 基本版仍可使用,但不支援新功能、高 QPS,或額外的安全性和法規遵循標準。

如要比較這兩個版本,請參閱「比較 Basic 和 Advanced 版本」。