Knowledge Catalog rileva i potenziali collegamenti tra gli asset di dati, aiutandoti a scoprire i dati correlati e a comprendere la natura della relazione.
Prima di iniziare
Prima di visualizzare le relazioni tra gli asset di dati, assicurati di disporre dei ruoli richiesti e di aver abilitato l'API necessaria.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per visualizzare le relazioni tra gli asset di dati, chiedi all'amministratore di concederti i seguenti ruoli IAM nel tuo progetto:
-
Per visualizzare le relazioni nelle tabelle e nelle viste BigQuery:
Visualizzatore metadati BigQuery (
roles/bigquery.metadataViewer)
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Abilita API
Per utilizzare le relazioni tra i dati, abilita le seguenti API nel tuo progetto: API Dataplex e API BigQuery.
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere
i ruoli.
Informazioni sulle relazioni tra i dati
Le relazioni tra i dati illustrano come sono collegati gli asset di dati. Ad esempio, se trovi una tabella con i dati dei clienti, le sue relazioni possono rivelare tabelle correlate che elencano ordini o ticket di assistenza. Inoltre, le relazioni fungono da guida strutturale, fornendo un contesto essenziale ai modelli linguistici di grandi dimensioni. Di conseguenza, l'AI genera risposte più precise, formulando query accurate per recuperare informazioni specifiche.
Knowledge Catalog rileva e archivia automaticamente le relazioni comuni tra gli asset di dati. I dati sulle relazioni provengono da varie fonti, ad esempio:
- Knowledge Catalog dei log delle query storiche che analizza continuamente la cronologia delle query per rilevare potenziali pattern
JOINtra le tabelle. - Gli approfondimenti sui dati suggeriscono relazioni tra i dati su richiesta analizzando gli attributi dello schema e le sovrapposizioni di dati utilizzando modelli linguistici di grandi dimensioni.
Asset di dati supportati
Puoi visualizzare le relazioni tra i dati per tabelle e viste BigQuery.
Visualizzare le relazioni tra i dati
Per visualizzare le relazioni tra i dati per tabelle e viste BigQuery, utilizza la console Google Cloud o l'API Knowledge Catalog.
console
Per visualizzare le relazioni tra i dati per una tabella in BigQuery:
Nella console Google Cloud , vai alla pagina Ricerca di Knowledge Catalog.
Cerca una tabella BigQuery per cui vuoi visualizzare le relazioni.
Nei risultati di ricerca, fai clic sulla tabella per aprire la relativa pagina di inserimento.
La scheda Relazioni elenca le relazioni insieme alle seguenti informazioni:
- Destinazione: il nome dell'asset di dati connesso.
- Relazione: le colonne specifiche utilizzate per collegare le risorse.
- Tipo:la natura del link. Ad esempio,
JOIN. - Origine:l'origine della relazione. Ad esempio, la cronologia delle query.
- Azione:una query di esempio che può essere utilizzata per scoprire il collegamento tra gli asset.
REST
Le relazioni rilevate vengono archiviate in Knowledge Catalog come EntryLinks che stabiliscono una relazione tra due asset di dati (voci) in Knowledge Catalog. I dettagli della relazione, come le colonne unite e l'origine della relazione, vengono archiviati come aspetti di EntryLinks.
Per visualizzare le relazioni tra i dati, utilizza i seguenti metodi:
LookupEntryLinksrecupera tutti iEntryLinksche fanno riferimento a una voce di dati specifica come origine o destinazione per restituire l'insieme completo di relazioni associate a una determinata voce.LookupContextfornisce un unico endpoint per l'ancoraggio degli agenti AI con metadati contestuali. Restituisce un pacchetto conciso e preformattato di metadati, incluse le risorse di dati correlate.
Località
Puoi utilizzare le relazioni tra i dati in tutte le località BigQuery.
Limitazioni
- Il rilevamento automatico delle relazioni dai log delle query è disponibile solo per tabelle e viste BigQuery.
- Knowledge Catalog analizza un campione della cronologia delle query per identificare le relazioni, il che significa che alcune query potrebbero non portare alla scoperta di link.
- L'individuazione delle relazioni potrebbe richiedere fino a 48 ore dopo l'esecuzione della query.