Knowledge Catalog (ehemals Dataplex Universal Catalog) erkennt potenzielle Verknüpfungen zwischen Daten-Assets, sodass Sie die zugehörigen Daten ermitteln und die Art der Beziehung nachvollziehen können.
Hinweis
Bevor Sie Beziehungen zwischen Daten-Assets ansehen, müssen Ihnen die erforderlichen Rollen zugewiesen werden.
Erforderliche Rollen
Um Beziehungen zwischen Daten-Assets in Knowledge Catalog aufzurufen, benötigen Sie keine IAM-Rollen, die speziell für Knowledge Catalog gelten.
Knowledge Catalog verwendet Ihre vorhandenen Berechtigungen für die Quellsysteme, in denen sich die Assets befinden, z. B. BigQuery, um zu ermitteln, ob Sie Beziehungen sehen können. Wenn Sie beispielsweise Beziehungen für eine BigQuery-Tabelle aufrufen möchten, benötigen Sie die Berechtigung bigquery.tables.get.
Wenn Sie keine Berechtigung haben, ein Asset in seinem Quellsystem anzusehen, werden alle Beziehungen, an denen dieses Asset beteiligt ist, im Beziehungsdiagramm des Knowledge Catalog ausgeblendet. So wird sichergestellt, dass die Sichtbarkeit von Beziehungen den in den Quellsystemen festgelegten Sicherheitsgrenzen und Berechtigungen entspricht.
Datenbeziehungen
Datenbeziehungen veranschaulichen, wie Daten-Assets miteinander verbunden sind. Wenn Sie beispielsweise eine Tabelle mit Kundendaten finden, können Sie anhand der Beziehungen zugehörige Tabellen mit Bestellungen oder Support-Tickets ermitteln. Außerdem dienen Beziehungen als strukturelle Orientierungshilfe und liefern Large Language Models wichtigen Kontext. So kann die KI präzisere Antworten generieren und genaue Anfragen formulieren, um spezifische Informationen abzurufen.
Knowledge Catalog ermittelt und speichert automatisch allgemeine Beziehungen zwischen den Daten-Assets. Die Beziehungsdaten stammen aus verschiedenen Quellen, z. B. aus den folgenden:
- Verlaufsabfragelogs Knowledge Catalog, in denen der Abfrageverlauf kontinuierlich analysiert wird, um potenzielle
JOIN-Muster zwischen Tabellen zu erkennen. - Datenstatistiken schlagen auf Anfrage Datenbeziehungen vor, indem sie Schemaattribute und Datenüberschneidungen mithilfe von Large Language Models analysieren.
Unterstützte Daten-Assets
Sie können Datenbeziehungen für BigQuery-Tabellen und -Ansichten ansehen.
Datenbeziehungen ansehen
Wenn Sie Datenbeziehungen für BigQuery-Tabellen und -Ansichten ansehen möchten, verwenden Sie dieGoogle Cloud -Konsole oder die Dataplex API.
Console
So rufen Sie Datenbeziehungen für eine Tabelle in BigQuery auf:
Rufen Sie in der Google Cloud Console die Seite Suchen im Knowledge Catalog auf.
Suchen Sie nach einer BigQuery-Tabelle, für die Sie Beziehungen aufrufen möchten.
Klicken Sie in den Suchergebnissen auf die Tabelle, um die zugehörige Eintragsseite zu öffnen.
Auf dem Tab Beziehungen werden Beziehungen zusammen mit den folgenden Informationen aufgeführt:
- Ziel: Der Name des verbundenen Daten-Assets.
- Beziehung: Die spezifischen Spalten, die zum Verknüpfen der Assets verwendet werden.
- Typ:Die Art des Links. Beispiel:
JOIN. - Ursprung:Der Ursprung der Beziehung. Zum Beispiel den Abfrageverlauf.
- Aktion:Eine Beispielabfrage, mit der die Verbindung zwischen den Assets ermittelt werden kann.
REST
Erkannte Beziehungen werden im Knowledge Catalog als EntryLinks gespeichert, die eine Beziehung zwischen zwei Daten-Assets (Einträgen) im Knowledge Catalog herstellen. Die Details zur Beziehung, z. B. die verknüpften Spalten und die Beziehungsquelle, werden als Aspekte von EntryLinks gespeichert.
Verwenden Sie die folgenden Methoden, um Datenbeziehungen aufzurufen:
LookupEntryLinksruft alleEntryLinksab, die auf einen bestimmten Dateneintrag als Quelle oder Ziel verweisen, um den vollständigen Satz von Beziehungen zurückzugeben, die einem bestimmten Eintrag zugeordnet sind.LookupContextbietet einen einzelnen Endpunkt, um KI-Agenten mit Kontextmetadaten zu verankern. Es wird ein prägnantes, vorformatiertes Paket mit Metadaten zurückgegeben, einschließlich zugehöriger Daten-Assets.
Standorte
Sie können Datenbeziehungen an allen BigQuery-Standorten verwenden.
Beschränkungen
- Die automatische Ermittlung von Beziehungen aus Abfragelogs ist nur für BigQuery-Tabellen und -Ansichten verfügbar.
- Knowledge Catalog analysiert eine Stichprobe des Abfrageverlaufs, um Beziehungen zu ermitteln. Das bedeutet, dass einige Abfragen möglicherweise nicht zum Auffinden von Links führen.
- Es kann bis zu 48 Stunden dauern, bis Beziehungen erkannt werden, nachdem die Abfrage ausgeführt wurde.