Visualizzare le relazioni tra i dati in Knowledge Catalog

Knowledge Catalog rileva i potenziali collegamenti tra gli asset di dati, aiutandoti a scoprire i dati correlati e a comprendere la natura della relazione.

Prima di iniziare

Prima di visualizzare le relazioni tra gli asset di dati, assicurati di disporre dei ruoli richiesti e di aver abilitato l'API necessaria.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per visualizzare le relazioni tra gli asset di dati, chiedi all'amministratore di concederti i seguenti ruoli IAM nel tuo progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Abilita API

Per utilizzare le relazioni tra i dati, abilita le seguenti API nel tuo progetto: API Dataplex e API BigQuery.

Ruoli richiesti per abilitare le API

Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

Abilita le API

Informazioni sulle relazioni tra i dati

Le relazioni tra i dati illustrano come sono collegati gli asset di dati. Ad esempio, se trovi una tabella con i dati dei clienti, le sue relazioni possono rivelare tabelle correlate che elencano ordini o ticket di assistenza. Inoltre, le relazioni fungono da guida strutturale, fornendo un contesto essenziale ai modelli linguistici di grandi dimensioni. Di conseguenza, l'AI genera risposte più precise, formulando query accurate per recuperare informazioni specifiche.

Knowledge Catalog rileva e archivia automaticamente le relazioni comuni tra gli asset di dati. I dati sulle relazioni provengono da varie fonti, ad esempio:

  • Knowledge Catalog dei log delle query storiche che analizza continuamente la cronologia delle query per rilevare potenziali pattern JOIN tra le tabelle.
  • Gli approfondimenti sui dati suggeriscono relazioni tra i dati su richiesta analizzando gli attributi dello schema e le sovrapposizioni di dati utilizzando modelli linguistici di grandi dimensioni.

Asset di dati supportati

Puoi visualizzare le relazioni tra i dati per tabelle e viste BigQuery.

Visualizzare le relazioni tra i dati

Per visualizzare le relazioni tra i dati per tabelle e viste BigQuery, utilizza la console Google Cloud o l'API Knowledge Catalog.

console

Per visualizzare le relazioni tra i dati per una tabella in BigQuery:

  1. Nella console Google Cloud , vai alla pagina Ricerca di Knowledge Catalog.

    Vai a Cerca

  2. Cerca una tabella BigQuery per cui vuoi visualizzare le relazioni.

  3. Nei risultati di ricerca, fai clic sulla tabella per aprire la relativa pagina di inserimento.

La scheda Relazioni elenca le relazioni insieme alle seguenti informazioni:

  • Destinazione: il nome dell'asset di dati connesso.
  • Relazione: le colonne specifiche utilizzate per collegare le risorse.
  • Tipo:la natura del link. Ad esempio, JOIN.
  • Origine:l'origine della relazione. Ad esempio, la cronologia delle query.
  • Azione:una query di esempio che può essere utilizzata per scoprire il collegamento tra gli asset.

REST

Le relazioni rilevate vengono archiviate in Knowledge Catalog come EntryLinks che stabiliscono una relazione tra due asset di dati (voci) in Knowledge Catalog. I dettagli della relazione, come le colonne unite e l'origine della relazione, vengono archiviati come aspetti di EntryLinks.

Per visualizzare le relazioni tra i dati, utilizza i seguenti metodi:

  • LookupEntryLinks recupera tutti i EntryLinks che fanno riferimento a una voce di dati specifica come origine o destinazione per restituire l'insieme completo di relazioni associate a una determinata voce.

  • LookupContext fornisce un unico endpoint per l'ancoraggio degli agenti AI con metadati contestuali. Restituisce un pacchetto conciso e preformattato di metadati, incluse le risorse di dati correlate.

Località

Puoi utilizzare le relazioni tra i dati in tutte le località BigQuery.

Limitazioni

  • Il rilevamento automatico delle relazioni dai log delle query è disponibile solo per tabelle e viste BigQuery.
  • Knowledge Catalog analizza un campione della cronologia delle query per identificare le relazioni, il che significa che alcune query potrebbero non portare alla scoperta di link.
  • L'individuazione delle relazioni potrebbe richiedere fino a 48 ore dopo l'esecuzione della query.

Passaggi successivi