Knowledge Catalog (in precedenza Dataplex Universal Catalog) rileva i potenziali collegamenti tra gli asset di dati, aiutandoti a scoprire i dati correlati e a comprendere la natura della relazione.
Prima di iniziare
Prima di visualizzare le relazioni tra gli asset di dati, assicurati di disporre dei ruoli richiesti.
Ruoli obbligatori
Per visualizzare le relazioni tra gli asset di dati in Knowledge Catalog, non hai bisogno di ruoli IAM specifici per Knowledge Catalog.
Knowledge Catalog utilizza le autorizzazioni esistenti sui sistemi di origine in cui risiedono gli asset, ad esempio BigQuery, per determinare la tua capacità di visualizzare le relazioni. Ad esempio, per visualizzare le relazioni che coinvolgono una tabella BigQuery, devi disporre dell'autorizzazione bigquery.tables.get.
Se non hai l'autorizzazione per visualizzare una risorsa nel sistema di origine, tutte le relazioni che la coinvolgono vengono nascoste nel grafico delle relazioni di Knowledge Catalog. In questo modo, la visibilità delle relazioni rispetta i limiti di sicurezza e le autorizzazioni stabiliti nei sistemi di origine.
Informazioni sulle relazioni tra i dati
Le relazioni tra i dati illustrano come sono collegati gli asset di dati. Ad esempio, se trovi una tabella con i dati dei clienti, le sue relazioni possono rivelare tabelle correlate che elencano ordini o ticket di assistenza. Inoltre, le relazioni fungono da guida strutturale, fornendo un contesto essenziale ai modelli linguistici di grandi dimensioni. Di conseguenza, l'AI genera risposte più precise, formulando query accurate per recuperare informazioni specifiche.
Knowledge Catalog rileva e archivia automaticamente le relazioni comuni tra gli asset di dati. I dati sulle relazioni provengono da varie fonti, ad esempio:
- Knowledge Catalog registra i log delle query storiche che analizzano continuamente la cronologia delle query per rilevare potenziali
JOINtra le tabelle. - Gli approfondimenti sui dati suggeriscono relazioni tra i dati su richiesta analizzando gli attributi dello schema e le sovrapposizioni di dati utilizzando modelli linguistici di grandi dimensioni.
Asset di dati supportati
Puoi visualizzare le relazioni tra i dati per tabelle e viste BigQuery.
Visualizzare le relazioni tra i dati
Per visualizzare le relazioni tra i dati per tabelle e viste BigQuery, utilizza la console Google Cloud o l'API Knowledge Catalog.
console
Per visualizzare le relazioni tra i dati per una tabella in BigQuery:
Nella console Google Cloud , vai alla pagina Ricerca di Knowledge Catalog.
Cerca una tabella BigQuery per cui vuoi visualizzare le relazioni.
Nei risultati di ricerca, fai clic sulla tabella per aprire la relativa pagina di inserimento.
La scheda Relazioni elenca le relazioni insieme alle seguenti informazioni:
- Destinazione: il nome dell'asset di dati connesso.
- Relazione: le colonne specifiche utilizzate per collegare le risorse.
- Tipo:la natura del link. Ad esempio,
JOIN. - Origine:l'origine della relazione. Ad esempio, la cronologia delle query.
- Azione:una query di esempio che può essere utilizzata per scoprire il collegamento tra gli asset.
REST
Le relazioni rilevate vengono archiviate in Knowledge Catalog come EntryLinks che stabiliscono una relazione tra due asset di dati (voci) in Knowledge Catalog. I dettagli della relazione, come le colonne unite e l'origine della relazione, vengono archiviati come aspetti di EntryLinks.
Per visualizzare le relazioni tra i dati, utilizza i seguenti metodi:
LookupEntryLinksrecupera tutti iEntryLinksche fanno riferimento a una voce di dati specifica come origine o destinazione per restituire l'insieme completo di relazioni associate a una determinata voce.LookupContextfornisce un unico endpoint per l'ancoraggio degli agenti AI con metadati contestuali. Restituisce un pacchetto conciso e preformattato di metadati, incluse le risorse di dati correlate.
Località
Puoi utilizzare le relazioni tra i dati in tutte le località BigQuery.
Limitazioni
- Il rilevamento automatico delle relazioni dai log delle query è disponibile solo per tabelle e viste BigQuery.
- Knowledge Catalog analizza un campione della cronologia delle query per identificare le relazioni, il che significa che alcune query potrebbero non portare alla scoperta di link.
- L'individuazione delle relazioni potrebbe richiedere fino a 48 ore dopo l'esecuzione della query.