In diesem Dokument wird eine allgemeine Architektur für eine Anwendung beschrieben, die mit einem agentenbasierten KI-Workflow ein interaktives Lernquiz erstellt und verwaltet. Der Agent bewertet das Wissen eines Nutzers zu einem bestimmten Thema und verwendet einen persistenten Sitzungsstatus und ein Langzeitgedächtnis, um eine personalisierte Erfahrung zu schaffen. Der Agent speichert einen Verlauf der Antworten des Nutzers, sodass er Schwierigkeitsgrad und Inhalt nachfolgender Fragen dynamisch anpassen kann.
Dieses Dokument richtet sich an Architekten, Entwickler und Administratoren, die agentenbasierte KI-Anwendungen entwickeln und verwalten. Diese Architektur lässt sich anpassen, um interaktive und zustandsorientierte Bildungsanwendungen für verschiedene Branchen zu erstellen. In diesem Dokument wird ein grundlegendes Verständnis von KI-Agentsystemen vorausgesetzt. Informationen dazu, wie sich Agents von nicht agentenbasierten Systemen unterscheiden, finden Sie unter Was ist der Unterschied zwischen KI-Agents, KI-Assistenten und Bots?
Im Abschnitt Bereitstellung dieses Dokuments finden Sie Links zu Codebeispielen, mit denen Sie die Bereitstellung einer agentenbasierten KI-Anwendung testen können, die einen Data-Science-Workflow ausführt.
Architektur
Das folgende Diagramm zeigt eine allgemeine Architektur für einen interaktiven Lern-Agent.
Die Architektur zeigt den folgenden Datenfluss:
- Ein Nutzer führt eine Aktion in der Quiz-App aus, z. B. ein Quiz starten oder eine Antwort senden. Die Quiz-App wird in Cloud Run gehostet.
- Die Anwendung leitet die Eingabe des Nutzers an den KI-Agenten weiter.
Der KI-Agent verwendet das Gemini-Modell in Vertex AI, um die Eingabe des Nutzers zu interpretieren. Je nach Anfrage des Nutzers ruft der Agent die entsprechenden Tools auf, um die gewünschte Quizaktion auszuführen.
Der Agent wählt beispielsweise ein Tool aus, um eine Quizsitzung zu starten, eine Antwort zu bewerten oder die nächste Frage zu generieren.
Der Agent sendet die Antwort an die Quiz-App.
Die Quizanwendung leitet die Antwort an den Nutzer weiter.
Damit der Status des Quiz beibehalten und die Nutzererfahrung personalisiert werden kann, führt der Agent die folgenden Hintergrundaufgaben aus:
- Der Agent fügt den neuesten Quizfortschritt und die aktuelle Punktzahl dem Verlauf der gespeicherten Sitzung hinzu, die in Vertex AI Agent Engine Sessions gespeichert ist.
- Der Agent wandelt Quizdaten in Erinnerungen um und speichert sie in der Memory Bank, damit sie langfristig abgerufen werden können. Der Agent verwendet die im Arbeitsspeicher gespeicherten Verlaufsdaten, um in zukünftigen Sitzungen kontextbezogene Antworten zu generieren.
Verwendete Produkte
In dieser Beispielarchitektur werden die folgenden Google Cloud Produkte verwendet:
- Cloud Run ist eine serverlose Computing-Plattform, mit der Sie Container direkt auf der skalierbaren Infrastruktur von Google ausführen können.
- Agent Development Kit (ADK): Eine Sammlung von Tools und Bibliotheken zum Entwickeln, Testen und Bereitstellen von KI-Agenten.
- Vertex AI: Eine ML-Plattform, mit der Sie ML-Modelle und KI-Anwendungen trainieren und bereitstellen und LLMs für die Verwendung in KI-basierten Anwendungen anpassen können.
- Vertex AI Agent Engine-Sitzungen: Ein persistenter Speicherdienst, der den Verlauf der Interaktionen zwischen einem Nutzer und Agenten speichert und abruft.
- Memory Bank: Ein Dienst für die dauerhafte Speicherung, der auf Grundlage der Unterhaltungen eines Nutzers mit einem Agent Langzeitgedächtnisse generiert, verfeinert, verwaltet und abruft.
Bereitstellung
Wenn Sie eine Beispielimplementierung dieser Architektur bereitstellen möchten, die Quizze zu Programmierfragen enthält, verwenden Sie das Python-Tutor-Codebeispiel, das auf GitHub verfügbar ist.
Nächste Schritte
- (Notebook) Erste Schritte mit Sessions und Memory Bank für ADK-Agents in Cloud Run
- (Blog) Weitere Informationen zum Zustand und Speicher mit dem ADK
- (Codelab) Einen KI-Assistenten für die Codeüberprüfung mit ADK erstellen
- (Video) Podcast „The Agent Factory“ zum Thema Speicher in KI-Agenten
- KI-Agents in Cloud Run hosten
- Eine Übersicht über Architekturprinzipien und Empfehlungen, die speziell für KI- und ML-Arbeitslasten in Google Cloudgelten, finden Sie im Well-Architected Framework in der KI- und ML-Perspektive.
- Weitere Referenzarchitekturen, Diagramme und Best Practices finden Sie im Cloud-Architekturcenter.
Beitragende
Autor: Samantha He | Technische Autorin
Weitere Beitragende:
- Amina Mansour | Head of Cloud Platform Evaluations Team
- Kumar Dhanagopal | Cross-Product Solution Developer
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Developer Relations Engineering Manager