Anwendungsfall für agentische KI: Data-Science-Workflows automatisieren

In diesem Dokument wird eine allgemeine Architektur für eine Anwendung beschrieben, die einen Data-Science-Workflow ausführt, um komplexe Datenanalyse- und Machine-Learning-Aufgaben zu automatisieren.

In dieser Architektur werden Datasets verwendet, die in BigQuery oder AlloyDB for PostgreSQL gehostet werden. Die Architektur ist ein Multi-Agent-System, mit dem Nutzer Aktionen in Befehlen in natürlicher Sprache ausführen können. Dadurch entfällt die Notwendigkeit, komplexen SQL- oder Python-Code zu schreiben.

Dieses Dokument richtet sich an Architekten, Entwickler und Administratoren, die agentenbasierte KI-Anwendungen entwickeln und verwalten. Mit dieser Architektur können Geschäfts- und Datenteams Messwerte in einer Vielzahl von Branchen analysieren, z. B. im Einzelhandel, im Finanzwesen und in der Fertigung. In diesem Dokument wird ein grundlegendes Verständnis von KI-Agentensystemen vorausgesetzt. Informationen dazu, wie sich Agents von nicht agentenbasierten Systemen unterscheiden, finden Sie unter Was ist der Unterschied zwischen KI-Agents, KI-Assistenten und Bots?

Im Abschnitt Bereitstellung dieses Dokuments finden Sie Links zu Codebeispielen, mit denen Sie die Bereitstellung einer agentenbasierten KI-Anwendung testen können, die einen Data-Science-Workflow ausführt.

Architektur

Das folgende Diagramm zeigt die Architektur eines Agents für Data-Science-Workflows.

Architektur für einen Data-Science-Workflow-Agent.

Diese Architektur umfasst die folgenden Komponenten:

Komponente Beschreibung
Frontend Nutzer interagieren über ein Frontend, z. B. eine Chat-Oberfläche, mit dem Multi-Agent-System. Das Frontend wird als serverloser Cloud Run-Dienst ausgeführt.
Agents In dieser Architektur werden die folgenden Agents verwendet:
  • Root-Agent: Ein Coordinator-Agent, der Anfragen vom Frontend-Dienst empfängt. Der Root-Agent interpretiert die Anfrage des Nutzers und versucht, sie selbst zu beantworten. Wenn für die Aufgabe spezielle Tools erforderlich sind, leitet der Stamm-Agent die Anfrage an den entsprechenden spezialisierten Agenten weiter.
  • Spezialisierter Agent: Der Stamm-Agent ruft die folgenden spezialisierten Agents mit der Funktion Agent als Tool auf.
    • Analytics-Agent: Ein spezialisierter Agent für Datenanalyse und ‑visualisierung. Der Analytics-Agent verwendet das KI-Modell, um Python-Code zu generieren und auszuführen, um Datasets zu verarbeiten, Diagramme zu erstellen und statistische Analysen durchzuführen.
    • AlloyDB for PostgreSQL-Agent: Ein spezieller Agent für die Interaktion mit Daten in AlloyDB for PostgreSQL. Der Agent verwendet das KI-Modell, um die Nutzeranfrage zu interpretieren und SQL im PostgreSQL-Dialekt zu generieren. Der Agent stellt über die MCP Toolbox for Databases eine sichere Verbindung zur Datenbank her und führt dann die Abfrage aus, um die angeforderten Daten abzurufen.
    • BigQuery-Agent: Ein spezieller Agent für die Interaktion mit Daten in BigQuery. Der Agent verwendet das KI-Modell, um die Nutzeranfrage zu interpretieren und GoogleSQL-Abfragen zu generieren. Der Agent stellt mithilfe des integrierten BigQuery-Tools des Agent Development Kit (ADK) eine Verbindung zur Datenbank her und führt dann die Abfrage aus, um die angeforderten Daten abzurufen.
  • BigQuery ML-Agent: Ein untergeordneter Agent des Stamm-Agents, der für Machine-Learning-Workflows vorgesehen ist. Der Agent interagiert mit BigQuery ML, um den End-to-End-ML-Lebenszyklus zu verwalten. Der Agent kann Modelle erstellen und trainieren, Auswertungen ausführen und Vorhersagen auf Grundlage von Nutzeranfragen generieren.
Laufzeit für Agents Die KI-Agents in dieser Architektur werden als serverlose Cloud Run-Dienste bereitgestellt.
ADK Das ADK bietet Tools und ein Framework zum Entwickeln, Testen und Bereitstellen von Agenten. Das ADK abstrahiert die Komplexität der Agentenerstellung und ermöglicht es KI-Entwicklern, sich auf die Logik und die Funktionen des Agenten zu konzentrieren.
KI-Modell und Modelllaufzeiten Für die Bereitstellung von Inferenzen verwenden die Agents in dieser Beispielarchitektur das neueste Gemini-Modell in Vertex AI.

Verwendete Produkte

In dieser Beispielarchitektur werden die folgenden Google Cloud und Open-Source-Produkte und ‑Tools verwendet:

  • Cloud Run ist eine serverlose Computing-Plattform, mit der Sie Container direkt auf der skalierbaren Infrastruktur von Google ausführen können.
  • Agent Development Kit (ADK): Eine Sammlung von Tools und Bibliotheken zum Entwickeln, Testen und Bereitstellen von KI-Agenten.
  • Vertex AI: Eine ML-Plattform, mit der Sie ML-Modelle und KI-Anwendungen trainieren und bereitstellen und LLMs für die Verwendung in KI-basierten Anwendungen anpassen können.
  • Gemini: Eine Reihe multimodaler KI-Modelle, die von Google entwickelt wurden.
  • BigQuery: Ein Data Warehouse für Unternehmen, mit dem Sie Ihre Daten mit integrierten Features wie raumbezogenen Analysen für maschinelles Lernen und Business Intelligence verwalten und analysieren können.
  • AlloyDB for PostgreSQL: Ein vollständig verwalteter, PostgreSQL-kompatibler Datenbankdienst, der für Ihre anspruchsvollsten Arbeitslasten entwickelt wurde, einschließlich hybrider transaktionsorientierter und analytischer Verarbeitung.
  • MCP Toolbox for Databases: Ein Open-Source-Server für das Model Context Protocol (MCP), mit dem KI-Agents sicher mit Datenbanken verbunden werden können. Dabei werden Datenbankkomplexitäten wie Connection Pooling, Authentifizierung und Beobachtbarkeit verwaltet.

Bereitstellung

Wenn Sie eine Beispielimplementierung dieser Architektur bereitstellen möchten, verwenden Sie Data Science with Multiple Agents. Das Repository enthält zwei Beispieldatasets, um die Flexibilität des Systems zu demonstrieren: ein Flugdataset für die operative Analyse und ein E-Commerce-Verkaufsdataset für die Unternehmensanalyse.

Nächste Schritte

Beitragende

Autor: Samantha He | Technische Autorin

Weitere Beitragende: