Questo documento risponde ad alcune delle domande frequenti relative a Knowledge Catalog (in precedenza Dataplex Universal Catalog).
Per saperne di più su Knowledge Catalog, consulta la panoramica di Knowledge Catalog.
Che cos'è Knowledge Catalog?
Google Knowledge Catalog è una soluzione di governance intelligente per i dati e gli asset AI in Google Cloud. Fornisce un inventario centralizzato in cui puoi scoprire, gestire e controllare i tuoi dati in Google Cloud origini dati come BigQuery, Cloud Storage, Pub/Sub e Spanner. Utilizza l'AI per automatizzare l'individuazione dei dati, l'arricchimento dei metadati e la qualità dei dati. Grazie al suo catalogo di dati controllati, Knowledge Catalog fornisce le basi essenziali di cui gli agenti AI hanno bisogno per generare contenuti di alta qualità.
Che cos'è Data Catalog?
Data Catalog era il nome originale del servizio di metadati di Google Cloud. Nel tempo, si è evoluto in Dataplex Universal Catalog, che ora è stato rinominato e si è evoluto in Knowledge Catalog.
Sebbene il termine "Data Catalog" venga ancora utilizzato per descrivere questo tipo di indicizzazione dei dati, nel contesto di Google Cloudsi riferisce al nostro prodotto legacy. Consigliamo a tutti i nuovi progetti di utilizzare Knowledge Catalog per sfruttare le funzionalità basate sull'AI e una governance avanzata.
Knowledge Catalog è diverso da Data Catalog?
Sì, Knowledge Catalog è la piattaforma di governance dei dati basata sull'AI che alla fine sostituirà Data Catalog esistente. Sebbene condividano concetti simili, Knowledge Catalog offre diversi miglioramenti:
Contesto basato sull'AI: a differenza di Data Catalog, Knowledge Catalog utilizza Gemini per estrarre automaticamente il contesto aziendale, generare descrizioni in linguaggio naturale e fornire "query dorate" SQL per basare gli agenti AI.
Supporto di metadati avanzati: Knowledge Catalog supporta tipi di metadati più complessi, come array, mappe e record nidificati.
Accesso agentico: gli agenti AI possono scoprire e utilizzare in modo adattivo gli strumenti di Knowledge Catalog tramite un server MCP locale o remoto.
Rilevamento dei dati: Knowledge Catalog può importare automaticamente i metadati da un insieme più ampio di servizi e origini dati esterne. Google Cloud
Governance su larga scala: offre funzionalità avanzate per la profilazione dei dati, la qualità dei dati automatica e la governance centralizzata.
A che cosa serve Knowledge Catalog?
Google Knowledge Catalog risolve il problema dell'"avvio a freddo dei dati", ovvero il tempo sprecato per trovare, comprendere e verificare i dati prima di poterli utilizzare. I suoi utilizzi principali includono:
Individuazione rapida dei dati: anziché navigare in complessi silos organizzativi per individuare i dati, puoi utilizzare la ricerca in linguaggio naturale (ad esempio, "Mostrami i dati più recenti sul churn dei clienti") per trovare istantaneamente asset nelle risorseGoogle Cloud , aumentando la produttività dei consumatori di dati.
Applicazione degli agenti AI: funge da "fonte di verità" per l'AI generativa o l'ADK. Collegando i dati fisici alle definizioni aziendali, si garantisce che gli agenti AI (come quelli basati su Vertex AI) utilizzino dati di alta qualità, il che riduce significativamente le allucinazioni dell'AI e migliora la fiducia negli insight generati dall'AI.
Governance dei dati automatizzata: esegue automaticamente la scansione dei dati per identificare le informazioni sensibili (come le PII), monitora la provenienza dei dati (derivazione) e ne monitora l'accuratezza (qualità dei dati automatica). Queste funzionalità contribuiscono a migliorare l'affidabilità, la sicurezza e la conformità dei dati con meno interventi manuali.
Rilevamento dei "dati oscuri": può scansionare file non strutturati (come PDF o immagini in Cloud Storage), estrarre le informazioni al loro interno e renderle ricercabili e interrogabili in BigQuery, il che ti aiuta a ottenere informazioni da dati precedentemente inaccessibili.
Per casi d'uso pratici, consulta Esplorare Knowledge Catalog.
Quali tipi di metadati memorizza Knowledge Catalog?
Knowledge Catalog archivia tre tipi di metadati:
Metadati tecnici: schemi, nomi di tabelle e proprietà di sistema acquisiti automaticamente.
Metadati aziendali: contesto definito dall'utente, ad esempio descrizioni aziendali, termini del glossario e proprietà.
Metadati di runtime: informazioni su derivazione dei dati, punteggi di qualità dei dati e statistiche di profilazione dei dati.
Come faccio a eseguire la migrazione da Data Catalog?
La transizione a Knowledge Catalog è progettata per essere fluida, senza richiedere lo spostamento manuale dei dati. A seconda del tuo utilizzo attuale, la procedura prevede due fasi principali:
Fase preparatoria: se hai metadati personalizzati (tag, modelli di tag o voci personalizzate), questi contenuti vengono importati automaticamente in Knowledge Catalog come di sola lettura. Durante questa fase, esegui le attività di configurazione per rendere i contenuti esistenti di Data Catalog disponibili contemporaneamente nella nuova interfaccia.
Fase di trasferimento: una volta preparati, trasferisci lo stato attivo dei metadati per renderli di lettura/scrittura in Knowledge Catalog. Questo passaggio deve essere coordinato con l'aggiornamento di eventuali carichi di lavoro programmatici (API, librerie client o moduli Terraform) in modo che puntino ai nuovi endpoint di Knowledge Catalog.
Se non hai metadati personalizzati o se non hai mai utilizzato la piattaforma, puoi completare la transizione impostando Knowledge Catalog come esperienza predefinita della UI nella console Google Cloud .
Per saperne di più, consulta Transizione da Data Catalog a Knowledge Catalog.