Esplora Knowledge Catalog
Knowledge Catalog (in precedenza Dataplex Universal Catalog) è una soluzione di governance dei dati basata sull'AI che fornisce un contesto di dati di alta qualità per consentire agli agenti di basare i contenuti generati. Questa pagina fornisce casi d'uso pratici per aiutarti a iniziare a utilizzare Knowledge Catalog.
Crea e potenzia gli agenti AI
Crea un agente per scoprire i tuoi dati
Esegui query complesse in linguaggio naturale sugli asset di dati aziendali utilizzando un agente di rilevamento che effettua chiamate all'API Knowledge Catalog (Python).
Crea un agente per arricchire i metadati
Genera overview basate sull'AI per le tue risorse di dati su larga scala utilizzando un agente di arricchimento che effettua chiamate API Knowledge Catalog (Python).
Utilizzare l'agente Gemini CLI per testare il contesto dei dati
Verifica che Knowledge Catalog possa distinguere tra dati di origine e derivati temporanei, utilizzando query in linguaggio naturale per Gemini CLI connessa a un server MCP locale.
Stabilisci la governance dei dati
Crea una base di dati
Configura un data lake "disordinato" e realistico in BigQuery, applica tag di metadati rigidi (aspetti) per distinguere i dati validi dal rumore e utilizza la CLI Gemini per verificare che rispetti le tue regole.
Configurare la governance di base
Collega metadati strutturati e basati su schema (aspetti) e definizioni aziendali (glossari) alle tue risorse di dati (voci) utilizzando la console Google Cloud.
Crea un lakehouse Iceberg gestito
Crea tabelle Apache Iceberg, applica policy di dati centralizzate per la sicurezza a livello di colonna, definisci policy di sicurezza e visualizza la derivazione automatica dei dati.
Analizzare la derivazione dei dati
Analizzare l'impatto delle modifiche ai dati
Identifica in che modo le trasformazioni dei dati influiscono sulle risorse downstream, sull'integrità dei dati e sui workflow.
Analizzare le cause di una fuga di PII
Trace il flusso di dati sensibili fino al processo che li sposta da una posizione attendibile a una non attendibile.
Ottimizzare i costi di archiviazione
Ridurre i costi di archiviazione identificando gli asset che non vengono utilizzati attivamente come origini per altri processi.
Automatizza la qualità dei dati con l'AI
Automatizzare le scansioni della qualità dei dati
Tramite Gemini CLI, utilizza query in linguaggio naturale per profilare i dati e generare regole di qualità, quindi esegui il deployment delle regole di qualità dei dati come scansioni automatizzate.