Knowledge Catalog (ehemals Dataplex Universal Catalog) erkennt potenzielle Verknüpfungen zwischen Daten-Assets. So können Sie die zugehörigen Daten finden und die Art der Beziehung verstehen.
Hinweis
Bevor Sie Beziehungen zwischen Daten-Assets aufrufen, müssen Ihnen die erforderlichen Rollen zugewiesen werden.
Erforderliche Rollen
Wenn Sie Beziehungen zwischen Daten-Assets in Knowledge Catalog aufrufen möchten, benötigen Sie keine IAM-Rollen, die speziell für Knowledge Catalog gelten.
Knowledge Catalog verwendet Ihre vorhandenen Berechtigungen für die Quellsysteme, in denen sich die Assets befinden, z. B. BigQuery, um zu ermitteln, ob Sie Beziehungen sehen können. Wenn Sie beispielsweise Beziehungen zu einer BigQuery-Tabelle sehen möchten, benötigen Sie die Berechtigung bigquery.tables.get.
Wenn Sie keine Berechtigung haben, ein Asset in seinem Quellsystem aufzurufen, werden alle Beziehungen zu diesem Asset im Knowledge Catalog-Beziehungsdiagramm ausgeblendet. So wird sichergestellt, dass die Sichtbarkeit von Beziehungen den Sicherheitsgrenzen und Berechtigungen entspricht, die in den Quellsystemen festgelegt wurden.
Datenbeziehungen
Datenbeziehungen veranschaulichen, wie Daten-Assets miteinander verbunden sind. Wenn Sie beispielsweise eine Tabelle mit Kundendaten finden, können Sie anhand der Beziehungen zugehörige Tabellen mit Bestellungen oder Supporttickets finden. Außerdem dienen Beziehungen als strukturelle Anleitung und liefern wichtige Kontextinformationen für Large Language Models. Dadurch kann die KI genauere Antworten generieren und präzise Abfragen formulieren, um bestimmte Informationen abzurufen.
Knowledge Catalog erkennt und speichert automatisch häufige Beziehungen zwischen den Daten-Assets. Die Beziehungsdaten stammen aus verschiedenen Quellen, z. B.:
- Verlaufslogs von Knowledge Catalog, in denen die Abfragehistorie kontinuierlich analysiert wird, um potenzielle
JOIN-Muster zwischen Tabellen zu erkennen. - Datenanalysen, die Datenbeziehungen auf Anfrage vorschlagen, indem sie mithilfe von Large Language Models Schemaattribute und Datenüberschneidungen analysieren.
Unterstützte Daten-Assets
Sie können Datenbeziehungen für BigQuery-Tabellen und ‑Ansichten aufrufen.
Datenbeziehungen aufrufen
Wenn Sie Datenbeziehungen für BigQuery-Tabellen und ‑Ansichten aufrufen möchten, verwenden Sie die Google Cloud Console oder die Knowledge Catalog API.
Console
So rufen Sie Datenbeziehungen für eine Tabelle in BigQuery auf:
Rufen Sie in der Google Cloud Console die Seite Suchen im Knowledge Catalog auf.
Suchen Sie nach einer BigQuery-Tabelle, für die Sie Beziehungen aufrufen möchten.
Klicken Sie in den Suchergebnissen auf die Tabelle, um die zugehörige Eintragsseite zu öffnen.
Auf dem Tab Beziehungen werden Beziehungen zusammen mit den folgenden Informationen aufgeführt:
- Ziel: Der Name des verbundenen Daten-Assets.
- Beziehung: Die spezifischen Spalten, die zum Verknüpfen der Assets verwendet werden.
- Typ:Die Art der Verknüpfung. Beispiel:
JOIN. - Quelle:Die Quelle der Beziehung. Beispiel: Abfrageverlauf.
- Aktion:Eine Beispielabfrage, mit der die Verknüpfung zwischen den Assets ermittelt werden kann.
REST
Erkannte Beziehungen werden in Knowledge Catalog als EntryLinks gespeichert, die eine Beziehung zwischen zwei Daten-Assets (Einträgen) in Knowledge Catalog herstellen. Die Details zur Beziehung, z. B. die verknüpften Spalten und die Quelle der Beziehung, werden als Aspekte von EntryLinks gespeichert.
Verwenden Sie die folgenden Methoden, um Datenbeziehungen aufzurufen:
LookupEntryLinksruft alleEntryLinksab, die auf einen bestimmten Dateneintrag als Quelle oder Ziel verweisen, um alle Beziehungen zurückzugeben, die mit einem bestimmten Eintrag verknüpft sind.LookupContextbietet einen einzelnen Endpunkt, um KI-Agents mit Kontextmetadaten zu verknüpfen. Es gibt ein prägnantes, vorformatiertes Metadatenpaket zurück, das auch zugehörige Daten-Assets enthält.
Standorte
Sie können Datenbeziehungen an allen BigQuery-Standorten verwenden.
Beschränkungen
- Die automatische Erkennung von Beziehungen aus Abfragelogs ist nur für BigQuery-Tabellen und ‑Ansichten verfügbar.
- Knowledge Catalog analysiert eine Stichprobe des Abfrageverlaufs, um Beziehungen zu ermitteln. Daher führen einige Abfragen möglicherweise nicht zur Erkennung von Verknüpfungen.
- Die Erkennung von Beziehungen kann bis zu 48 Stunden nach der Ausführung der Abfrage dauern.