Knowledge Catalog für KI-Agenten

Da Datenökosysteme immer komplexer werden, benötigen KI-Anwendungen mehr als nur Zugriff auf Rohdaten. Sie benötigen geschäftlichen Kontext. Knowledge Catalog ist eine Weiterentwicklung von Dataplex, bei der der Fokus auf der Unterstützung von KI- und Agent-Systemen liegt.

Im Zentrum dieser Plattform steht eine einheitliche Karte, die Ihre physischen Daten-Assets mit Geschäftssemantik, Governance-Regeln und Nutzungsbeziehungen verknüpft. Durch die Integration von Knowledge Catalog in Ihre KI-Workflows können Sie Folgendes erreichen:

  • KI-Agenten so konfigurieren, dass sie zuverlässige, aktuelle und kontextbezogene Metadaten liefern, um die Argumentation des Agenten zu steuern.

  • Halluzinationen reduzieren und dafür sorgen, dass generative Modelle ihre Antworten auf etablierte Unternehmenswahrheiten stützen.

  • KI-Agents einen einheitlichen Kontext bieten – eine einzelne, verwaltete Ansicht Ihrer Datenlandschaft.

Anwendungsfälle

Knowledge Catalog spielt im Daten- und KI-Lebenszyklus unterschiedliche Rollen:

  • KI-Entwickler und Agenten-Builder Entwickler, die benutzerdefinierte Bots oder Agenten erstellen (z. B. mit LangChain oder dem Agent Development Kit (ADK)), die Unternehmensdaten abfragen und verstehen müssen.

    • Anwendungsfälle:Suche in natürlicher Sprache und Abrufen von Kontext, damit Agenten mit Unternehmensdaten arbeiten können; agentische Datenermittlung.
  • Datenanalyst*innen. Nutzer, die KI-basierte Tools wie Gemini in BigQuery oder Looker verwenden, um Daten zu finden und ihre geschäftliche Bedeutung zu verstehen.

    • Anwendungsfälle:Abfragen in natürlicher Sprache und konversationelle Datenanalyse.
  • Data Stewards: Fachexperten, die die KI-gestützte Metadatenanreicherung überwachen und für die Qualität des Kontextes des Katalogs sorgen.

    • Anwendungsfälle:KI-generierte Metadaten und Beschreibungen prüfen, kuratieren und bewerben.

Mit MCP auf den Knowledge Catalog-Kontext zugreifen

Das Model Context Protocol (MCP) ist eine standardisierte Brücke, die es KI-Agenten und ‑Tools ermöglicht, nahtlos eine Verbindung zu Datenquellen wie dem Knowledge Catalog herzustellen.

Um verschiedenen Bereitstellungsabläufen gerecht zu werden, bietet Knowledge Catalog zwei Arten von MCP-Implementierungen. Es ist wichtig zu wissen, wann welche Methode verwendet werden sollte, um Ihre Umgebung einzurichten:

  • Remote-MCP-Server:beim Erstellen cloudnativer Anwendungen, beim Bereitstellen von Agents in serverlosen Umgebungen (z. B. Cloud Run) oder bei der Integration in externe verwaltete Dienste, bei denen Sie die Verwaltung der lokalen Infrastruktur vermeiden möchten.

  • Lokale MCP-Toolbox:bei der lokalen Agent-Entwicklung, beim Rapid Prototyping oder wenn Sie eine direkte Integration in lokale Desktop-IDEs wie VS Code oder Cursor benötigen.

Remote-MCP-Server

Ein von Google gehosteter Endpunkt, der direkten Zugriff auf Knowledge Catalog-Tools für KI-Anwendungen und ‑Dienste ermöglicht (z. B. Agents, die in Cloud Run ausgeführt werden, oder externe Dienste wie Claude).

  • Endpunkt: https://dataplex.googleapis.com/mcp
  • Vorteile:Es ist kein lokaler MCP-Server erforderlich. Geeignet für serverlose Umgebungen.
  • Referenz:Remote-MCP-Server verwenden

Lokale MCP Toolbox

Ein Befehlszeilentool, das als lokaler Proxy zwischen Ihrer IDE (z. B. VS Code, Cursor) oder lokalen Tools und dem Knowledge Catalog fungiert.

  • Installation:Herunterladbare Binärdatei.
  • Konfiguration:Hierbei wird in der Regel eine .mcp.json- oder Einstellungsdatei in Ihrem Projekt oder Ihrer IDE-Konfiguration verwendet.
  • Vorteile:Ideal für lokal sichere Entwicklungsumgebungen und die Integration in verschiedene IDEs.
  • Referenz:Lokalen MCP-Server verwenden

Kontext für Knowledge Catalog anreichern

Damit Knowledge Catalog für KI optimal genutzt werden kann, muss der zugrunde liegende Graph reich an Geschäftskontext sein. Sie können dies mit Standardfunktionen oder benutzerdefinierter agentischer Anreicherung erreichen.

Sofortige Anreicherung mit Datenstatistiken

Datenstatistiken (basierend auf Gemini in BigQuery) reichern Ihren Katalog automatisch an und verringern so das „Kaltstart“-Problem für neue Datenplattformen. Wenn diese Option aktiviert ist, werden automatisch die folgenden Elemente generiert:

  • Beschreibungen auf Dataset- und Spaltenebene.
  • Beziehungsdiagramme zwischen Tabellen.
  • Beispielabfragen basierend auf historischen Nutzungsmustern.

So können nachgelagerte Agents die Semantik sofort erfassen, ohne dass eine manuelle Data Stewardship erforderlich ist.

Für eine Tabelle mit dem Namen telco_churn können beispielsweise automatisch Beschreibungen für Felder wie Tenure und MonthlyCharges generiert, Beziehungen zu Kundentabellen abgeleitet und eine Beispielabfrage wie die Suche nach Churn-Raten nach Segment im Katalog veröffentlicht werden.

Benutzerdefinierte Kontextanreicherung mit Agenten

Für Organisationen mit spezialisierten Wissensdatenbanken können Sie benutzerdefinierte Anreicherungs-Agents erstellen, um Metadaten aus benutzerdefinierten Quellen wie internen Wikis, Code-Repositories oder proprietären Systemen zu erfassen.

  • Knowledge Catalog APIs (CRUD-Vorgänge): Damit können Sie Metadaten im Katalog hinzufügen oder aktualisieren.

    • Rufen Sie beispielsweise die API-Methode UpdateEntry auf, um einem Tabellenübersichtsaspekt programmatisch Dokumentation aus einem internen System anzuhängen.
  • Tools wie das ADK:Damit erstellen Sie Ihre Enrichment-Agents.

    • Sie können beispielsweise einen Java-basierten ADK-Agenten erstellen, der interne Tools verwendet, um technische Wiki-Seiten zu extrahieren, ein LLM, um sie in Glossarbegriffe zu parsen, und die Begriffe mit dem Knowledge Catalog synchronisiert.
  • Export- und Importvorgänge:Für Bulk-Metadatenaktualisierungen mit Überprüfung verwenden.

    • Sie können beispielsweise ein KI-generiertes Unternehmensglossar in eine Datei exportieren, die Definitionen von Datenverantwortlichen gemeinsam überprüfen und optimieren lassen und die endgültige Datei wieder in den Katalog importieren.

Nächste Schritte