Explorer Knowledge Catalog
Knowledge Catalog (anciennement Dataplex Universal Catalog) est une solution de gouvernance des données basée sur l'IA qui fournit un contexte de données de haute qualité aux agents pour ancrer le contenu généré. Cette page vous propose des cas d'utilisation pratiques pour vous aider à vous lancer avec Knowledge Catalog.
Créer et alimenter des agents d'IA
Créer un agent pour découvrir vos données
Exécutez des requêtes complexes en langage naturel sur des ressources de données d'entreprise à l'aide d'un agent de découverte qui effectue des appels à l'API Knowledge Catalog (Python).
Créer un agent pour enrichir les métadonnées
Générez des résumés optimisés par l'IA pour vos composants de données à grande échelle, à l'aide d'un agent d'enrichissement qui effectue des appels à l'API Knowledge Catalog (Python).
Utiliser l'agent Gemini CLI pour tester le contexte des données
Vérifiez que Knowledge Catalog peut faire la distinction entre les données sources et les dérivés temporaires, en utilisant des requêtes en langage naturel pour Gemini CLI connecté à un serveur MCP local.
Établir la gouvernance des données
Créer une infrastructure de données
Configurez un lac de données "désordonné" réaliste dans BigQuery, appliquez des tags de métadonnées (aspects) rigides pour différencier les données valides du bruit, et utilisez l'interface de ligne de commande Gemini pour vérifier qu'il respecte vos règles.
Configurer la gouvernance de base
Associez des métadonnées structurées et basées sur un schéma (aspects) et des définitions métier (glossaires) à vos composants de données (entrées) à l'aide de la console Google Cloud.
Créer un lakehouse Iceberg gouverné
Créez des tables Apache Iceberg, appliquez des règles de données centralisées pour la sécurité au niveau des colonnes, définissez des règles de sécurité et visualisez la traçabilité des données automatisée.
Analyser la traçabilité des données
Analyser l'impact des modifications de données
Identifier l'impact des transformations de données sur les ressources en aval, l'intégrité des données et les workflows
Analyser les causes d'une fuite d'informations permettant d'identifier personnellement l'utilisateur
Retracez le flux de données sensibles jusqu'au processus qui les déplace d'un emplacement approuvé vers un emplacement non approuvé.
Optimiser les coûts de stockage
Réduisez les coûts de stockage en identifiant les composants qui ne sont pas activement utilisés comme sources pour d'autres processus.
Automatiser la qualité des données avec l'IA
Automatiser les analyses de la qualité des données
Grâce à l'interface de ligne de commande Gemini, utilisez des requêtes en langage naturel pour profiler des données et générer des règles de qualité, puis déployez ces règles sous forme d'analyses automatisées.