Anwendungsfall für agentische KI: Data-Science-Workflows automatisieren

Last reviewed 2025-12-08 UTC

In diesem Dokument wird eine allgemeine Architektur für eine Anwendung beschrieben, die einen Data-Science-Workflow ausführt, um komplexe Datenanalyse- und Machine-Learning-Aufgaben zu automatisieren.

Diese Architektur verwendet Datensätze, die in BigQuery oder AlloyDB for PostgreSQL gehostet werden. Die Architektur ist ein Multi-Agenten-System, mit dem Nutzer Aktionen in Befehlen in natürlicher Sprache ausführen können. Dadurch ist es nicht mehr erforderlich, komplexen SQL- oder Python-Code zu schreiben.

Die Zielgruppe für dieses Dokument umfasst Architekten, Entwickler und Administratoren, die agentische KI-Anwendungen erstellen und verwalten. Mit dieser Architektur können Geschäfts- und Datenteams Messwerte in einer Vielzahl von Branchen analysieren, z. B. im Einzelhandel, im Finanzwesen und in der Fertigung. In diesem Dokument wird ein grundlegendes Verständnis von agentischen KI-Systemen vorausgesetzt. Informationen dazu, wie sich Agenten von nicht Agenten-basierten Systemen unterscheiden, finden Sie unter Was ist der Unterschied zwischen KI-Agenten, KI-Assistenten und Bots?

Im Bereitstellungsabschnitt dieses Dokuments finden Sie Links zu Code beispielen, mit denen Sie die Bereitstellung einer agentischen KI-Anwendung testen können, die einen Data-Science-Workflow ausführt.

Architektur

Das folgende Diagramm zeigt die Architektur für einen Data-Science-Workflow-Agenten.

Architektur für einen Data-Science-Workflow-Agent.

Diese Architektur umfasst die folgenden Komponenten:

Komponente Beschreibung
Frontend Nutzer interagieren über ein Frontend, z. B. eine Chat-Oberfläche, mit dem Multi-Agenten-System. Das Frontend wird als serverloser Cloud Run-Dienst ausgeführt.
Agents Diese Architektur verwendet die folgenden Agenten:
  • Root-Agent: Ein Koordinationsagent, der Anfragen vom Frontend-Dienst empfängt. Der Root-Agent interpretiert die Anfrage des Nutzers und versucht, sie selbst zu beantworten. Wenn für die Aufgabe spezielle Tools erforderlich sind, leitet der Root-Agent die Anfrage an den entsprechenden spezialisierten Agenten weiter.
  • Spezialisierter Agent: Der Root Agent ruft die folgenden spezialisierten Agenten mit der Funktion „Agent als Tool“ auf.
    • Analytics-Agent: Ein spezialisierter Agent für Datenanalyse und ‑visualisierung. Der Analytics-Agent verwendet das KI-Modell, um Python-Code zu generieren und auszuführen, um Datensätze zu verarbeiten, Diagramme zu erstellen und statistische Analysen durchzuführen.
    • AlloyDB for PostgreSQL-Agent: Ein spezialisierter Agent für die Interaktion mit Daten in AlloyDB for PostgreSQL. Der Agent verwendet das KI-Modell, um die Anfrage des Nutzers zu interpretieren und SQL im PostgreSQL-Dialekt zu generieren. Der Agent stellt mit der MCP Toolbox for Databases eine sichere Verbindung zu der Datenbank her und führt dann die Abfrage aus, um die angeforderten Daten abzurufen.
    • BigQuery-Agent: Ein spezialisierter Agent für die Interaktion mit Daten in BigQuery. Der Agent verwendet das KI-Modell, um die Anfrage des Nutzers zu interpretieren und GoogleSQL Abfragen zu generieren. Der Agent stellt mit dem integrierten BigQuery-Tool des Agent Development Kit (ADK) eine Verbindung zur Datenbank her und führt dann die Abfrage aus, um die angeforderten Daten abzurufen.
  • BigQuery ML-Agent: Ein Unteragent des Root Agenten, der für Machine-Learning-Workflows zuständig ist. Der Agent interagiert mit BigQuery ML, um den End-to-End-ML-Lebenszyklus zu verwalten. Der Agent kann Modelle erstellen und trainieren, Auswertungen ausführen und Vorhersagen basierend auf Nutzeranfragen generieren.
Laufzeit für Agenten Die KI-Agenten in dieser Architektur werden als serverlose Cloud Run-Dienste bereitgestellt.
ADK ADK bietet Tools und ein Framework zum Entwickeln, Testen und Bereitstellen von Agenten. Das ADK abstrahiert die Komplexität der Agentenerstellung und ermöglicht es KI-Entwicklern, sich auf die Logik und Funktionen des Agenten zu konzentrieren.
KI-Modell und Modelllaufzeiten Für die Inferenzbereitstellung verwenden die Agenten in dieser Beispielarchitektur das neueste Gemini-Modell in Vertex AI.

Verwendete Produkte

In dieser Beispielarchitektur werden die folgenden Google Cloud und Open-Source Produkte und ‑Tools verwendet:

  • Cloud Run: Eine serverlose Computing-Plattform, mit der Sie Container direkt auf der skalierbaren Infrastruktur von Google ausführen können.
  • Agent Development Kit (ADK): Eine Reihe von Tools und Bibliotheken zum Entwickeln, Testen und Bereitstellen von KI-Agenten.
  • Vertex AI: Eine ML-Plattform, mit der Sie ML-Modelle und KI-Anwendungen trainieren und bereitstellen und LLMs für die Verwendung in KI-basierten Anwendungen anpassen können.
  • Gemini: Eine Familie multimodaler KI-Modelle, die von Google entwickelt wurden.
  • BigQuery: Ein Data Warehouse für Unternehmen, mit dem Sie Ihre Daten mit integrierten Features wie raumbezogenen Analysen für maschinelles Lernen und Business Intelligence verwalten und analysieren können.
  • AlloyDB for PostgreSQL: Ein vollständig verwalteter, PostgreSQL-kompatibler Datenbankdienst, der für Ihre anspruchsvollsten Arbeitslasten entwickelt wurde, einschließlich hybrider transaktionsorientierter und analytischer Verarbeitung.
  • MCP Toolbox for Databases: Ein Open-Source- Model Context Protocol (MCP)-Server, mit dem KI-Agenten sicher eine Verbindung zu Datenbanken herstellen können. Dabei werden Datenbankkomplexitäten wie Verbindungspooling, Authentifizierung und Beobachtbarkeit verwaltet.

Bereitstellung

Verwenden Sie Data Science with Multiple Agents, um eine Beispielimplementierung dieser Architektur bereitzustellen. Das Repository enthält zwei Beispieldatensätze, um die Flexibilität des Systems zu demonstrieren, darunter ein Flugdatensatz für die Betriebsanalysen und ein E-Commerce-Umsatzdatensatz für die Geschäftsanalysen.

Nächste Schritte

Beitragende

Autor: Samantha He | Technischer Autor

Weitere Beitragende: