Datenbeziehungen in Knowledge Catalog ansehen

Knowledge Catalog (ehemals Dataplex Universal Catalog) erkennt potenzielle Verknüpfungen zwischen Daten-Assets, sodass Sie die zugehörigen Daten ermitteln und die Art der Beziehung nachvollziehen können.

Hinweis

Bevor Sie Beziehungen zwischen Daten-Assets ansehen, müssen Ihnen die erforderlichen Rollen zugewiesen werden.

Erforderliche Rollen

Um Beziehungen zwischen Daten-Assets im Knowledge Catalog aufzurufen, benötigen Sie keine IAM-Rollen, die speziell für Knowledge Catalog gelten. Knowledge Catalog verwendet Ihre vorhandenen Berechtigungen für die Quellsysteme, in denen sich die Assets befinden, z. B. BigQuery, um zu ermitteln, ob Sie Beziehungen sehen können. Wenn Sie beispielsweise Beziehungen für eine BigQuery-Tabelle sehen möchten, benötigen Sie die Berechtigung bigquery.tables.get.

Wenn Sie keine Berechtigung haben, ein Asset in seinem Quellsystem aufzurufen, werden alle Beziehungen, an denen dieses Asset beteiligt ist, im Beziehungsdiagramm des Knowledge Catalog ausgeblendet. So wird sichergestellt, dass die Sichtbarkeit von Beziehungen den Sicherheitsgrenzen und Berechtigungen entspricht, die in den Quellsystemen festgelegt sind.

Datenbeziehungen

Datenbeziehungen veranschaulichen, wie Daten-Assets miteinander verbunden sind. Wenn Sie beispielsweise eine Tabelle mit Kundendaten finden, können Sie anhand der Beziehungen zugehörige Tabellen mit Bestellungen oder Support-Tickets ermitteln. Außerdem dienen Beziehungen als strukturelle Orientierungshilfe und liefern wichtigen Kontext für große Sprachmodelle. So kann KI präzisere Antworten generieren und genaue Anfragen formulieren, um spezifische Informationen abzurufen.

Knowledge Catalog ermittelt und speichert automatisch gängige Beziehungen zwischen den Daten-Assets. Die Beziehungsdaten stammen aus verschiedenen Quellen, z. B. aus den folgenden:

  • Historische Abfragelogs Knowledge Catalog, in denen der Abfrageverlauf kontinuierlich analysiert wird, um potenzielle JOIN-Muster zwischen Tabellen zu erkennen.
  • Datenstatistiken schlagen auf Anfrage Datenbeziehungen vor, indem sie Schemaattribute und Datenüberschneidungen mithilfe von Large Language Models analysieren.

Unterstützte Daten-Assets

Sie können Datenbeziehungen für BigQuery-Tabellen und -Ansichten ansehen.

Datenbeziehungen ansehen

Wenn Sie Datenbeziehungen für BigQuery-Tabellen und -Ansichten ansehen möchten, verwenden Sie die Google Cloud -Konsole oder die Knowledge Catalog API.

Console

So rufen Sie Datenbeziehungen für eine Tabelle in BigQuery auf:

  1. Rufen Sie in der Google Cloud Console die Seite Suchen im Knowledge Catalog auf.

    Zur Suche

  2. Suchen Sie nach einer BigQuery-Tabelle, für die Sie Beziehungen aufrufen möchten.

  3. Klicken Sie in den Suchergebnissen auf die Tabelle, um die zugehörige Eintragsseite zu öffnen.

Auf dem Tab Beziehungen werden Beziehungen zusammen mit den folgenden Informationen aufgeführt:

  • Ziel: Der Name des verbundenen Daten-Assets.
  • Beziehung: Die spezifischen Spalten, die zum Verknüpfen der Assets verwendet werden.
  • Typ:Die Art des Links. Beispiel: JOIN.
  • Ursprung:Der Ursprung der Beziehung. Zum Beispiel den Abfrageverlauf.
  • Aktion:Eine Beispielabfrage, mit der die Verbindung zwischen den Assets ermittelt werden kann.

REST

Erkannte Beziehungen werden in Knowledge Catalog als EntryLinks gespeichert, die eine Beziehung zwischen zwei Daten-Assets (Einträgen) in Knowledge Catalog herstellen. Die Details zur Beziehung, z. B. die verknüpften Spalten und die Beziehungsquelle, werden als Aspekte von EntryLinks gespeichert.

Verwenden Sie die folgenden Methoden, um Datenbeziehungen aufzurufen:

  • Mit LookupEntryLinks werden alle EntryLinks abgerufen, die auf einen bestimmten Dateneintrag als Quelle oder Ziel verweisen, um den vollständigen Satz von Beziehungen zurückzugeben, die einem bestimmten Eintrag zugeordnet sind.

  • LookupContext bietet einen einzelnen Endpunkt, um KI-Agenten mit Kontextmetadaten zu verankern. Es wird ein prägnantes, vorformatiertes Paket mit Metadaten zurückgegeben, einschließlich zugehöriger Daten-Assets.

Standorte

Sie können Datenbeziehungen an allen BigQuery-Standorten verwenden.

Beschränkungen

  • Die automatische Erkennung von Beziehungen aus Abfragelogs ist nur für BigQuery-Tabellen und -Ansichten verfügbar.
  • Knowledge Catalog analysiert eine Stichprobe des Abfrageverlaufs, um Beziehungen zu erkennen. Das bedeutet, dass einige Abfragen möglicherweise nicht zur Linkermittlung führen.
  • Es kann bis zu 48 Stunden dauern, bis Beziehungen nach der Ausführung der Abfrage erkannt werden.

Nächste Schritte