Anwendungsfall für agentische KI: Data-Science-Workflows automatisieren

Last reviewed 2025-12-08 UTC

In diesem Dokument wird eine allgemeine Architektur für eine Anwendung beschrieben, in der ein Data-Science-Workflow ausgeführt wird, um komplexe Datenanalyse- und Machine-Learning-Aufgaben zu automatisieren.

In dieser Architektur werden Datasets verwendet, die in BigQuery oder AlloyDB for PostgreSQL gehostet werden. Die Architektur ist ein Multi-Agenten-System, mit dem Nutzer Aktionen in Befehlen in natürlicher Sprache ausführen können. So ist es nicht mehr erforderlich, komplexen SQL- oder Python-Code zu schreiben.

Dieses Dokument richtet sich an Architekten, Entwickler und Administratoren, die agentenbasierte KI-Anwendungen erstellen und verwalten. Mit dieser Architektur können Geschäfts- und Datenteams Messwerte in einer Vielzahl von Branchen analysieren, z. B. im Einzelhandel, im Finanzwesen und in der Fertigung. In diesem Dokument wird davon ausgegangen, dass Sie ein grundlegendes Verständnis von agentischen KI-Systemen haben. Informationen dazu, wie sich Agents von nicht agentischen Systemen unterscheiden, finden Sie unter Was ist der Unterschied zwischen KI-Agents, KI-Assistenten und Bots?

Im Abschnitt Bereitstellung dieses Dokuments finden Sie Links zu Codebeispielen, mit denen Sie die Bereitstellung einer agentenbasierten KI-Anwendung testen können, die einen Data-Science-Workflow ausführt.

Architektur

Das folgende Diagramm zeigt die Architektur eines Agents für Data-Science-Workflows.

Architektur für einen Data-Science-Workflow-Agent.

Diese Architektur umfasst die folgenden Komponenten:

Komponente Beschreibung
Frontend Nutzer interagieren mit dem Multi-Agent-System über ein Frontend, z. B. eine Chat-Oberfläche, die als serverloser Cloud Run-Dienst ausgeführt wird.
Agents In dieser Architektur werden die folgenden Agents verwendet:
  • Root-Agent: Ein Coordinator-Agent, der Anfragen vom Frontend-Dienst empfängt. Der Root-Agent interpretiert die Anfrage des Nutzers und versucht, sie selbst zu beantworten. Wenn für die Aufgabe spezielle Tools erforderlich sind, leitet der Stamm-Agent die Anfrage an den entsprechenden spezialisierten Agenten weiter.
  • Spezialisierter Agent: Der Stamm-Agent ruft die folgenden spezialisierten Agenten mit der Funktion Agent als Tool auf.
    • Analytics-Agent: Ein spezialisierter Agent für die Datenanalyse und ‑visualisierung. Der Analytics-Agent verwendet das KI-Modell, um Python-Code zu generieren und auszuführen, um Datasets zu verarbeiten, Diagramme zu erstellen und statistische Analysen durchzuführen.
    • AlloyDB for PostgreSQL-Agent: Ein spezieller Agent für die Interaktion mit Daten in AlloyDB for PostgreSQL. Der Agent verwendet das KI-Modell, um die Nutzeranfrage zu interpretieren und SQL im PostgreSQL-Dialekt zu generieren. Der Agent stellt über die MCP Toolbox for Databases eine sichere Verbindung zur Datenbank her und führt dann die Abfrage aus, um die angeforderten Daten abzurufen.
    • BigQuery-Agent: Ein spezieller Agent für die Interaktion mit Daten in BigQuery. Der Agent verwendet das KI-Modell, um die Nutzeranfrage zu interpretieren und GoogleSQL-Abfragen zu generieren. Der Agent stellt mithilfe des integrierten BigQuery-Tools des Agent Development Kit (ADK) eine Verbindung zur Datenbank her und führt dann die Abfrage aus, um die angeforderten Daten abzurufen.
  • BigQuery ML-Agent: Ein untergeordneter Agent des Stamm-Agents, der für Workflows für maschinelles Lernen vorgesehen ist. Der Agent interagiert mit BigQuery ML, um den End-to-End-ML-Lebenszyklus zu verwalten. Der Agent kann Modelle erstellen und trainieren, Auswertungen durchführen und Vorhersagen auf Grundlage von Nutzeranfragen generieren.
Laufzeit für KI-Agenten Die KI-Agents in dieser Architektur werden als serverlose Cloud Run-Dienste bereitgestellt.
ADK Das ADK bietet Tools und ein Framework zum Entwickeln, Testen und Bereitstellen von KI-Agenten. Das ADK abstrahiert die Komplexität der Agentenerstellung und ermöglicht es KI-Entwicklern, sich auf die Logik und die Funktionen des Agenten zu konzentrieren.
KI-Modell und Modelllaufzeiten Für die Bereitstellung von Inferenzanfragen verwenden die Agents in dieser Beispielarchitektur das neueste Gemini-Modell auf der Gemini Enterprise Agent Platform.

Verwendete Produkte

In dieser Beispielarchitektur werden die folgenden Google Cloud und Open-Source-Produkte und ‑Tools verwendet:

  • Cloud Run ist eine serverlose Computing-Plattform, mit der Sie Container direkt auf der skalierbaren Infrastruktur von Google ausführen können.
  • Agent Development Kit (ADK): Eine Sammlung von Tools und Bibliotheken zum Entwickeln, Testen und Bereitstellen von KI-Agenten.
  • Gemini Enterprise Agent Platform: Eine umfassende Plattform, mit der Sie KI‑Agenten auf Unternehmensniveau erstellen, skalieren, verwalten und optimieren können.
  • Gemini: Eine Reihe multimodaler KI-Modelle, die von Google entwickelt wurden.
  • BigQuery: Ein Data Warehouse für Unternehmen, mit dem Sie Ihre Daten mit integrierten Features wie maschinellem Lernen, raumbezogenen Analysen und Business Intelligence verwalten und analysieren können.
  • AlloyDB for PostgreSQL: Ein vollständig verwalteter, PostgreSQL-kompatibler Datenbankdienst, der für Ihre anspruchsvollsten Arbeitslasten entwickelt wurde, einschließlich hybrider transaktionsorientierter und analytischer Verarbeitung.
  • MCP Toolbox for Databases: Ein Open-Source-Server für das Model Context Protocol (MCP), mit dem KI-Agenten sicher eine Verbindung zu Datenbanken herstellen können, indem Datenbankkomplexitäten wie Connection Pooling, Authentifizierung und Beobachtbarkeit verwaltet werden.

Bereitstellung

Verwenden Sie Data Science with Multiple Agents, um eine Beispielimplementierung dieser Architektur bereitzustellen. Das Repository enthält zwei Beispieldatasets, um die Flexibilität des Systems zu demonstrieren: ein Flugdataset für die operative Analyse und ein E-Commerce-Verkaufsdataset für die Unternehmensanalyse.

Nächste Schritte

Beitragende

Autorin: Samantha He | Technische Autorin

Weitere Beitragende: