Knowledge Catalog kennenlernen
Knowledge Catalog (ehemals Dataplex Universal Catalog) ist eine KI-gestützte Lösung für die Daten-Governance, die Agenten hochwertigen Datenkontext zur Verfügung stellt, um generierte Inhalte zu untermauern. Auf dieser Seite finden Sie praktische Anwendungsfälle, die Ihnen den Einstieg in Knowledge Catalog erleichtern.
KI-Agents erstellen und unterstützen
Agent zum Ermitteln Ihrer Daten erstellen
Führen Sie komplexe Abfragen in natürlicher Sprache für Unternehmensdaten aus. Verwenden Sie dazu einen Discovery-Agenten, der Knowledge Catalog API-Aufrufe ausführt (Python).
Agent zum Anreichern von Metadaten erstellen
KI-basierte Übersichten für Ihre Daten-Assets im großen Maßstab erstellen – mit einem Enrichment-Agent, der Knowledge Catalog API-Aufrufe ausführt (Python).
Gemini CLI-Agent zum Testen des Datenkontexts verwenden
Prüfen Sie, ob Knowledge Catalog zwischen Quelldaten und temporären Ableitungen unterscheiden kann. Verwenden Sie dazu Anfragen in natürlicher Sprache an die Gemini CLI, die mit einem lokalen MCP-Server verbunden ist.
Data Governance einrichten
Datengrundlage schaffen
Richten Sie einen realistischen, „unordentlichen“ Data Lake in BigQuery ein, weisen Sie starre Metadaten-Tags (Aspekte) zu, um gültige Daten von Rauschen zu unterscheiden, und verwenden Sie die Gemini CLI, um zu prüfen, ob sie Ihren Regeln entspricht.
Grundlegende Governance einrichten
Mit der Google Cloud Console können Sie Ihren Daten-Assets (Einträgen) strukturierte, schemabasierte Metadaten (Aspekte) und Unternehmensdefinitionen (Glossare) zuweisen.
Reguliertes Iceberg-Lakehouse erstellen
Apache Iceberg-Tabellen erstellen, zentralisierte Datenrichtlinien für Sicherheit auf Spaltenebene erzwingen, Sicherheitsrichtlinien definieren und automatische Datenherkunft visualisieren
Data Lineage analysieren
Auswirkungen von Datenänderungen analysieren
Ermitteln, wie sich Datentransformationen auf nachgelagerte Ressourcen, Datenintegrität und Workflows auswirken.
Ursachen eines PII-Leaks analysieren
Verfolgen Sie den Fluss vertraulicher Daten zurück zu dem Prozess, der sie von einem vertrauenswürdigen zu einem nicht vertrauenswürdigen Speicherort verschiebt.
Speicherkosten optimieren
Speicherkosten senken, indem Sie Assets identifizieren, die nicht aktiv als Quellen für andere Prozesse verwendet werden.
Datenqualität mit KI automatisieren
Datenqualitätsscans automatisieren
Mit der Gemini CLI können Sie Daten mit Anfragen in natürlicher Sprache profilieren und Qualitätsregeln generieren. Anschließend können Sie Datenqualitätsregeln als automatisierte Scans bereitstellen.