Enterprise Knowledge Graph – Übersicht

Enterprise Knowledge Graph organisiert isolierte Informationen in organisatorisches Wissen. Dies umfasst die effiziente und nützliche Konsolidierung, die Standardisierung und den Abgleich von Daten.

Entity Reconciliation API

Die Entity Reconciliation API ist ein einfacher, KI-gestützter Dienst für semantisches Clustering und Deduplizierung für tabellarische Daten. Es handelt sich um eine eigenständige API, die die Google-Engine zur Entitätsauflösung umschließt. Sie hilft Kunden, ihre Daten abzugleichen und zusammenzuführen oder ihre Daten mit einem oder mehreren Datensätzen von Drittanbietern zusammenzuführen.

Besondere Merkmale:

  • Vortrainiertes Modell mit Google-Daten in höchster Qualität.
  • Integrierte Entitätsanreicherung, einschließlich Geocodierung.
  • Clustering und Abgleich im Google-Maßstab, das einen Graphen mit bis zu Milliarden von Knoten und Billionen von Kanten verarbeiten kann.
  • Die stabile Maschinen-ID (MID) ist eine eindeutige Kennung für jeden der Entitätscluster.
  • Native Unterstützung für bis zu 10 BigQuery-Tabellen.

Funktionsweise

Enterprise Knowledge Graph-Konzept

In relationalen Datenbanken erfolgt der Abgleich hauptsächlich über streng verwaltete Schlüssel, z. B. Kundennummern. Einige unterstützen Fuzzy-Matching, z. B. „Robert Smith“ im Vergleich zu „Bob Smith“. In Graphen erfolgt der Abgleich durch die Verwendung einer beliebigen Kombination aus Fuzzy-Text, gemeinsamen Beziehungen, Entitätstypen und ihren Attributen. Das funktioniert gut, wenn Daten aus einer heterogenen Mischung von Systemen zusammengeführt werden.

Die Entity Reconciliation API liest Daten aus BigQuery-Quelltabelle anhand einer Reihe von Entitätstypen und Dateien, die einem gemeinsamen Schema zugeordnet sind. Anschließend wird die Wissensextraktion durchgeführt um die relationalen Eingabedaten in RDF-Triples wie eine Knowledge Graph-Darstellung umzuwandeln. Die Google-Engine zur Entitätsauflösung erstellt dann einen Graphen, um Entitäten in verschiedenen Gruppen zu clustern. Entitäten in derselben Gruppe werden als übereinstimmend betrachtet. Im letzten Schritt wird das Verknüpfungsergebnis (übereinstimmend und nicht übereinstimmend) in Form einer neuen eindeutigen Kennungsspalte (MID) in die vom Kunden angegebenen BigQuery-Tabellen ausgegeben.

Google Knowledge Graph Search API

Die Suche nach Schlüsselwörtern oder das Suchen nach Entitäten mit einer ID im Google Knowledge Graph erfolgt über die Google Knowledge Graph Search API. Die API verwendet Standardtypen von schema.org und entspricht der JSON-LD-Spezifikation.

Mit der API können Sie Folgendes tun:

  • Entitätsauflösung für eine Organisation, ein Produkt, einen Ort, ein Buch, einen Film und viele weitere Entitäten durchführen.
  • Ihre private Entität mit einer weltweit eindeutigen Maschinen-ID (MID) des Cloud Knowledge Graph verknüpfen.
  • Eine sortierte Liste der wichtigsten Entitäten abrufen, die bestimmten Kriterien entsprechen.
  • Inhalte mit den Entitäten des Google Knowledge Graph annotieren und organisieren.
  • Mit zusätzlichen IDs, die von der Google Knowledge Graph Search API zurückgegeben werden, z. B. der Google Place ID, eine Verbindung zum breiteren Datenökosystem herstellen.
  • Nach Entitäten anhand von MIDs suchen, die von anderen Google Cloud APIs zurückgegeben werden, z. B. der Cloud Vision API, der Cloud Natural Language API und der Cloud Video Intelligence API.

Versionen der Google Knowledge Graph Search API

Die Google Knowledge Graph Search API ist in zwei Versionen verfügbar:

  • Basic
  • Advanced

Beide Versionen unterstützen die Entitätssuche und ‑abfrage. Sie verwenden auch dieselben Knowledge Graph-Entitäten, die von erstellt wurden Google Cloud. Die Enterprise-Version enthält zusätzliche Funktionen wie die Verknüpfung mit der Google Place ID und eine zusätzliche Datenabdeckung.

Wenn Sie ein neues Projekt planen, erstellen Sie Ihre Anwendung mit der Advanced-Version des Cloud Knowledge Graph, um die neuen Funktionen und Dienstverbesserungen nutzen zu können. Die Basic-Version ist weiterhin verfügbar, unterstützt aber keine neuen Funktionen, hohe QPS oder zusätzliche Sicherheits- und Compliance-Standards.

Einen Vergleich der beiden Versionen finden Sie unter Basic- und Advanced-Versionen vergleichen.