Da Datenökosysteme immer komplexer werden, benötigen KI-Anwendungen mehr als nur Zugriff auf Rohdaten. Sie benötigen geschäftlichen Kontext. Knowledge Catalog ist eine Weiterentwicklung von Dataplex, bei der der Fokus auf der Unterstützung von KI- und Agentensystemen liegt.
Im Mittelpunkt dieser Plattform steht eine einheitliche Zuordnung, die Ihre physischen Daten-Assets mit geschäftlicher Semantik, Governance-Regeln und Nutzungsbeziehungen verknüpft. Wenn Sie Knowledge Catalog in Ihre KI-Workflows einbinden, können Sie Folgendes erreichen:
KI-Agenten auf zuverlässige, aktuelle und kontextbezogene Metadaten stützen, um die Entscheidungsfindung des Agenten zu unterstützen.
Halluzinationen reduzieren und sicherstellen, dass generative Modelle ihre Antworten auf etablierte Unternehmensfakten stützen.
KI-Agenten einen einheitlichen Kontext zur Verfügung stellen – eine einzige, verwaltete Ansicht Ihrer Datenlandschaft.
Anwendungsfälle
Knowledge Catalog erfüllt unterschiedliche Rollen im gesamten Daten- und KI-Lebenszyklus:
KI-Entwickler und Agenten-Builder Entwickler, die benutzerdefinierte Bots oder Agenten erstellen (z. B. mit LangChain oder dem Agent Development Kit (ADK)), die Unternehmensdaten abfragen und verstehen müssen.
- Anwendungsfälle:Suche in natürlicher Sprache und Abruf von Kontext, damit Agenten mit Unternehmensdaten arbeiten können; agentengestützte Datenermittlung.
Datenanalysten Nutzer, die KI-gestützte Tools wie Gemini in BigQuery oder Looker verwenden, um Daten zu finden und ihre geschäftliche Bedeutung zu verstehen.
- Anwendungsfälle:Abfragen in natürlicher Sprache und konversationelle Datenexploration.
Datenverwalter Domainexperten, die die KI-gestützte Metadatenanreicherung überwachen und die Qualität des Katalogs sicherstellen.
- Anwendungsfälle:Überprüfen, Kuratieren und Fördern von KI-generierten Metadaten und Beschreibungen.
Mit MCP auf den Knowledge Catalog-Kontext zugreifen
Das Model Context Protocol (MCP) ist eine standardisierte Brücke, mit der KI-Agenten und -Tools nahtlos eine Verbindung zu Datenquellen wie Knowledge Catalog herstellen können.
Um unterschiedlichen Bereitstellungs-Workflows gerecht zu werden, bietet Knowledge Catalog zwei Arten von MCP-Implementierungen. Es ist wichtig zu wissen, wann welche Implementierung verwendet werden sollte, um Ihre Umgebung einzurichten:
Remote-MCP-Server:Beim Erstellen cloudnativer Anwendungen, Bereitstellen von Agenten in serverlosen Umgebungen (z. B. Cloud Run) oder bei der Integration mit externen verwalteten Diensten, bei denen Sie die Verwaltung der lokalen Infrastruktur vermeiden möchten.
Lokale MCP-Toolbox:Bei der lokalen Agentenentwicklung, beim schnellen Prototyping oder wenn Sie eine direkte Integration mit lokalen Desktop-IDEs wie VS Code oder Cursor benötigen.
Remote-MCP-Server
Ein von Google gehosteter Endpunkt, der direkten Zugriff auf Knowledge Catalog-Tools für KI-Anwendungen und -Dienste ermöglicht (z. B. Agenten, die in Cloud Run ausgeführt werden, oder externe Dienste wie Claude).
- Endpunkt:
https://dataplex.googleapis.com/mcp - Vorteile:Es ist kein lokaler MCP-Server erforderlich; geeignet für serverlose Umgebungen.
- Referenz:Remote-MCP-Server verwenden
Lokale MCP-Toolbox
Ein Befehlszeilentool, das als lokaler Proxy zwischen Ihrer IDE (z. B. VS Code, Cursor) oder lokalen Tools und Knowledge Catalog fungiert.
- Installation:Herunterladbare Binärdatei.
- Konfiguration:In der Regel ist eine
.mcp.json- oder Einstellungsdatei in Ihrer Projekt- oder IDE-Konfiguration erforderlich. - Vorteile:Ideal für sichere lokale Entwicklungsumgebungen und die Integration mit verschiedenen IDEs.
- Referenz: Lokalen MCP-Server verwenden
Kontext für Knowledge Catalog anreichern
Damit Knowledge Catalog für KI optimal genutzt werden kann, muss der zugrunde liegende Graph reich an geschäftlichem Kontext sein. Sie können dies mit sofort einsatzbereiten Funktionen oder benutzerdefinierter agentengestützter Anreicherung erreichen.
Sofort einsatzbereite Anreicherung mit Dateneinblicken
Dateneinblicke (powered by Gemini in BigQuery) reichern Ihren Katalog automatisch an und reduzieren so das Problem des „Kaltstarts“ für neue Datenplattformen. Wenn diese Funktion aktiviert ist, werden automatisch folgende Elemente generiert:
- Beschreibungen auf Dataset- und Spaltenebene.
- Beziehungsdiagramme zwischen Tabellen.
- Beispielabfragen basierend auf bisherigen Nutzungsmustern.
So erhalten nachgelagerte Agenten sofort semantische Informationen, ohne dass eine manuelle Datenverwaltung erforderlich ist.
Für eine Tabelle mit dem Namen telco_churn können Dateneinblicke beispielsweise automatisch Beschreibungen für Felder wie Tenure und MonthlyCharges generieren, Beziehungen zu Kundentabellen ableiten und eine Beispielabfrage wie „Churn-Raten nach Segment“ im Katalog veröffentlichen.
Benutzerdefinierte Kontextanreicherung mit Agenten
Für Unternehmen mit spezialisierten Wissensdatenbanken können Sie benutzerdefinierte Anreicherungsagenten erstellen, um Metadaten aus benutzerdefinierten Quellen wie internen Wikis, Code-Repositories oder proprietären Systemen aufzunehmen.
Knowledge Catalog APIs (CRUD-Vorgänge) : Zum Hinzufügen oder Aktualisieren von Metadaten im Katalog verwenden.
- Rufen Sie beispielsweise die API-Methode
UpdateEntryauf, um einer Tabelle programmatisch einen Übersichtsaspekt anzuhängen, indem Sie die Dokumentation aus einem internen System extrahieren.
- Rufen Sie beispielsweise die API-Methode
Tools wie das ADK:Zum Erstellen Ihrer Anreicherungsagenten verwenden.
- Erstellen Sie beispielsweise einen Java-basierten ADK-Agenten, der interne Tools verwendet, um technische Wiki-Seiten zu extrahieren, ein LLM verwendet, um sie in Glossarbegriffe zu parsen, und die Begriffe mit Knowledge Catalog synchronisiert.
Export- und Importvorgänge:Für Bulk-Metadatenaktualisierungen mit Überprüfung verwenden.
- Exportieren Sie beispielsweise ein KI-generiertes Unternehmensglossar in eine Datei, lassen Sie Datenverwalter die Definitionen gemeinsam überprüfen und verfeinern und importieren Sie die endgültige Datei wieder in den Katalog.
Nächste Schritte
Remote-MCP-Server von Knowledge Catalog verwenden.
Knowledge Catalog mit MCP, Gemini und anderen Agenten verwenden.
Auf Dateneinblicke in Knowledge Catalog zugreifen.