Enterprise Knowledge Graph 會將資訊孤島整理成機構知識,以有效率且實用的方式整合、標準化及協調資料。
Entity Reconciliation API
Entity Reconciliation API 是一項輕量型服務,可運用 AI 技術對表格資料進行語意叢集和重複資料刪除作業。這項獨立 API 會包裝 Google 核心實體解析引擎。協助顧客比對及合併資料,或將資料與一或多個第三方資料集合併。
Key features include:
- 使用 Google 資料訓練的預先訓練模型,品質最先進。
- 內建實體擴充功能,包括地理編碼。
- Google 規模的叢集和對帳功能,可處理節點多達數十億個、邊緣多達數兆個的圖表。
- 穩定機器 ID (MID) 是每個實體叢集的專屬 ID。
- 最多可直接支援 10 個 BigQuery 資料表。
運作方式

在關聯式資料庫中,比對作業主要透過嚴格管理的鍵 (例如客戶 ID) 進行。部分支援模糊比對,例如「Robert Smith」與「Bob Smith」。在圖表中,系統會使用模糊文字、常見關係、實體類型及其屬性的任意組合進行比對。如果要在異質系統組合中合併資料,這項功能就非常實用。
Entity Reconciliation API 會讀取來源 BigQuery 資料表中的資料,並提供一組實體型別和對應至通用結構定義的檔案。接著執行知識擷取作業,將輸入的關聯資料轉換為 RDF 三元組,例如知識圖譜表示法。Google 實體對帳引擎接著會建構圖表,將實體分組 (同一群組中的實體視為相符)。最後一個步驟是將連結結果 (相符和不相符) 輸出至客戶指定的 BigQuery 資料表,並以新的專屬 ID 欄 (MID) 形式呈現。
Google Knowledge Graph Search API
透過關鍵字搜尋或使用 ID 查詢 Google 知識圖譜中的實體時,系統會使用 Google Knowledge Graph Search API。這個 API 使用標準 schema.org 型別,並符合 JSON-LD 規格。
使用 API 執行下列操作:
- 對機構、產品、地點、書籍、電影和更多實體執行實體解析。
- 將私有實體連結至全球唯一的 Cloud Knowledge Graph 機器 ID (MID)。
- 取得符合特定條件的顯著實體排名清單。
- 使用 Google 知識圖譜實體為內容加上註解及分類。
- 透過 Google 知識圖譜搜尋 API 傳回的其他 ID (例如 Google 地點 ID),連結至更廣泛的資料生態系統。
- 從其他 API (例如 Cloud Vision API、Cloud Natural Language API 和 Cloud Video Intelligence API) 傳回的 MID 搜尋實體 Google Cloud
Google 知識圖譜 Search API 版本
Google Knowledge Graph Search API 提供兩種版本:
BasicAdvanced
這兩個版本都支援實體搜尋和查詢。這些模型也提供 Google Cloud建構的相同基礎知識圖譜實體。Enterprise 版提供多項額外功能,例如連結至 Google 地點 ID 和額外資料涵蓋範圍。
如果您正在規劃新專案,請使用 Cloud 知識圖譜 Advanced 版建構應用程式,才能利用新功能與改善的服務項目。Basic 版仍可使用,但不支援新功能、高 QPS,或額外的安全性和法規遵循標準。
如要比較這兩個版本,請參閱「比較 Basic 和 Advanced 版本」。