Visualizzare le relazioni tra i dati in Knowledge Catalog

Knowledge Catalog (in precedenza Dataplex Universal Catalog) rileva i potenziali link tra gli asset di dati, aiutandoti a scoprire i dati correlati e a comprendere la natura della relazione.

Prima di iniziare

Prima di visualizzare le relazioni tra gli asset di dati, assicurati di avere i ruoli richiesti.

Ruoli obbligatori

Per visualizzare le relazioni tra gli asset di dati in Knowledge Catalog, non hai bisogno di ruoli IAM specifici per Knowledge Catalog. Knowledge Catalog utilizza le autorizzazioni esistenti sui sistemi di origine in cui risiedono gli asset, ad esempio BigQuery, per determinare la tua capacità di visualizzare le relazioni. Ad esempio, per visualizzare le relazioni che coinvolgono una tabella BigQuery, devi disporre dell'autorizzazione bigquery.tables.get.

Se non hai l'autorizzazione per visualizzare un asset nel suo sistema di origine, tutte le relazioni che coinvolgono l'asset sono nascoste nel grafico delle relazioni di Knowledge Catalog. In questo modo, la visibilità delle relazioni rispetta i limiti di sicurezza e le autorizzazioni stabilite nei sistemi di origine.

Informazioni sulle relazioni tra i dati

Le relazioni tra i dati illustrano come si collegano gli asset di dati. Ad esempio, se individui una tabella con i dati dei clienti, le sue relazioni possono rivelare tabelle correlate che elencano gli ordini o le richieste di assistenza. Inoltre, le relazioni fungono da guida strutturale, fornendo un contesto essenziale ai modelli linguistici di grandi dimensioni. Di conseguenza, l'AI genera risposte più precise, formulando query accurate per recuperare informazioni specifiche.

Knowledge Catalog rileva e archivia automaticamente le relazioni comuni tra gli asset di dati. I dati delle relazioni provengono da varie fonti, ad esempio:

  • Log delle query storiche di Knowledge Catalog che analizzano continuamente la cronologia delle query per rilevare potenziali pattern JOIN tra le tabelle.
  • Gli approfondimenti sui dati suggeriscono le relazioni tra i dati on demand analizzando gli attributi dello schema e le sovrapposizioni dei dati utilizzando modelli linguistici di grandi dimensioni.

Asset di dati supportati

Puoi visualizzare le relazioni tra i dati per le tabelle e le viste BigQuery.

Visualizzare le relazioni tra i dati

Per visualizzare le relazioni tra i dati per le tabelle e le viste BigQuery, utilizza la Google Cloud console o l'API Knowledge Catalog.

console

Per visualizzare le relazioni tra i dati per una tabella in BigQuery:

  1. Nella Google Cloud console, vai alla pagina Ricerca di Knowledge Catalog.

    Vai alla pagina Ricerca

  2. Cerca una tabella BigQuery per cui vuoi visualizzare le relazioni.

  3. Nei risultati di ricerca, fai clic sulla tabella per aprire la relativa pagina della voce.

La scheda Relazioni elenca le relazioni insieme alle seguenti informazioni:

  • Destinazione: il nome dell'asset di dati connesso.
  • Relazione: le colonne specifiche utilizzate per collegare gli asset.
  • Tipo:la natura del link. Ad esempio, JOIN.
  • Origine:l'origine della relazione. Ad esempio, la cronologia delle query.
  • Azione:una query di esempio che può essere utilizzata per scoprire il link tra gli asset.

REST

Le relazioni rilevate vengono archiviate in Knowledge Catalog come EntryLinks che stabiliscono una relazione tra due asset di dati (voci) in Knowledge Catalog. I dettagli della relazione, come le colonne unite e l'origine della relazione, vengono archiviati come aspetti di EntryLinks.

Per visualizzare le relazioni tra i dati, utilizza i seguenti metodi:

  • LookupEntryLinks recupera tutti i EntryLinks che fanno riferimento a una voce di dati specifica come origine o destinazione per restituire l'insieme completo di relazioni associate a una determinata voce.

  • LookupContext fornisce un singolo endpoint per basare gli agenti AI con metadati contestuali. Restituisce un pacchetto di metadati conciso e preformattato, inclusi gli asset di dati correlati.

Località

Puoi utilizzare le relazioni tra i dati in tutte le località BigQuery.

Limitazioni

  • Il rilevamento automatico delle relazioni dai log delle query è disponibile solo per le tabelle e le viste BigQuery.
  • Knowledge Catalog analizza un campione della cronologia delle query per identificare le relazioni, il che significa che alcune query potrebbero non portare al rilevamento dei link.
  • Il rilevamento delle relazioni potrebbe richiedere fino a 48 ore dopo l'esecuzione della query.

Passaggi successivi