Enterprise Knowledge Graph – Übersicht

Mit Enterprise Knowledge Graph werden isolierte Informationen in organisatorisches Wissen umgewandelt. Dies umfasst die effiziente und nützliche Konsolidierung, die Standardisierung und den Abgleich von Daten.

Entity Reconciliation API

Die Entity Reconciliation API ist ein einfacher, KI-basierter Dienst für semantisches Clustering und Deduplizierung von tabellarischen Daten. Es handelt sich um eine eigenständige API, die die Google-Engine zur Auflösung von Kernentitäten umschließt. So können Kunden ihre Daten abgleichen und zusammenführen oder mit einem oder mehreren Drittanbieter-Datasets zusammenführen.

Besondere Merkmale:

  • Vortrainiertes Modell mit Google-Daten in höchster Qualität.
  • Integrierte Anreicherung von Entitäten, einschließlich Geocoding.
  • Clustering und Abgleich im Google-Maßstab, bei dem ein Diagramm mit bis zu Milliarden von Knoten und Billionen von Kanten verarbeitet wird.
  • Die stabile Maschinen-ID (MID) ist eine eindeutige Kennung für jeden der Entitätscluster.
  • Bis zu 10 BigQuery-Tabellen werden nativ unterstützt.

Funktionsweise

Enterprise Knowledge Graph – Konzept

In relationalen Datenbanken erfolgt der Abgleich in erster Linie über sorgfältig verwaltete Schlüssel, z. B. Kundennummern. Einige unterstützen die unscharfe Suche, z. B. „Robert Smith“ im Vergleich zu „Bob Smith“. In Graphs erfolgt der Abgleich durch die Verwendung einer beliebigen Kombination aus unscharfem Text, gemeinsamen Beziehungen, Entitätstypen und ihren Attributen. Das ist besonders nützlich, wenn Sie Daten aus verschiedenen Systemen zusammenführen.

Die Entity Reconciliation API liest Daten aus BigQuery-Quelltabelle, die auf eine Reihe von Entitätstypen und Dateien mit einem gemeinsamen Schema abgebildet sind. Anschließend werden die relationalen Eingabedaten in RDF-Tripel wie eine Knowledge Graph-Darstellung umgewandelt. Die Google Entity Reconciliation-Engine erstellt dann ein Diagramm, um Entitäten in verschiedenen Gruppen zu clustern. Entitäten in derselben Gruppe werden als übereinstimmend betrachtet. Im letzten Schritt wird das Verknüpfungsergebnis (übereinstimmend und nicht übereinstimmend) in Form einer neuen Spalte mit eindeutigen Kennungen (MID) in die vom Kunden angegebenen BigQuery-Tabellen ausgegeben.

Google Knowledge Graph Search API

Bei der Suche nach einem Keyword oder dem Nachschlagen von Entitäten mit einer ID im Google Knowledge Graph wird die Google Knowledge Graph Search API verwendet. Die API verwendet Standardtypen für schema.org und entspricht der JSON-LD-Spezifikation.

Mit der API haben Sie folgende Möglichkeiten:

  • Entitätenabgleich für eine Organisation, ein Produkt, einen Ort, ein Buch, einen Film und viele weitere Entitäten durchführen
  • Verknüpfen Sie Ihre private Entität mit einer global eindeutigen Cloud Knowledge Graph-Maschinen-ID (MID).
  • Eine nach Rangfolge sortierte Liste der wichtigsten Elemente, die bestimmten Kriterien entsprechen.
  • Inhalte mithilfe der Google Knowledge Graph-Objekte annotieren und organisieren.
  • Mit zusätzlichen IDs, die von der Google Knowledge Graph Search API zurückgegeben werden, z. B. der Google Place ID, können Sie eine Verbindung zum gesamten Datenökosystem herstellen.
  • Nach Entitäten anhand von MIDs suchen, die von anderen Google Cloud APIs wie der Cloud Vision API, der Cloud Natural Language API und der Cloud Video Intelligence API zurückgegeben werden

Versionen der Google Knowledge Graph Search API

Die Google Knowledge Graph Search API ist in zwei Versionen verfügbar:

  • Basic
  • Advanced

Beide Versionen unterstützen die Suche nach und das Nachschlagen von Entitäten. Sie greifen auch auf dieselben Knowledge Graph-Objekte zu, die von Google Clouderstellt wurden. Die Enterprise-Version umfasst zusätzliche Funktionen wie die Verknüpfung mit der Google Place ID und eine zusätzliche Datenabdeckung.

Wenn Sie ein neues Projekt planen, erstellen Sie Ihre Anwendung mit der Advanced-Version von Cloud Knowledge Graph, um die neuen Funktionen und Dienstverbesserungen nutzen zu können. Die Basic-Version ist weiterhin verfügbar, unterstützt jedoch keine neuen Funktionen, hohe QPS oder zusätzliche Sicherheits- und Compliance-Standards.

Einen Vergleich der beiden Versionen finden Sie unter Basic- und Advanced-Versionen vergleichen.