KI-Agents in Cloud Run hosten

Auf dieser Seite werden Anwendungsfälle für das Hosten von KI-Agents in Cloud Run beschrieben.

KI-Agenten sind autonome Softwareeinheiten, die LLM-basierte Systeme verwenden, um Ziele zu erreichen. Da immer mehr autonome Agenten entwickelt werden, wird ihre Fähigkeit zur Kommunikation und Zusammenarbeit immer wichtiger.

Eine Einführung in KI-Agenten finden Sie unter Was ist ein KI-Agent?.

Anwendungsfälle für KI-Agents in Cloud Run

Sie können KI-Agents als Cloud Run-Dienste implementieren, um eine Reihe asynchroner Aufgaben zu orchestrieren und Informationen über mehrere Anfrage-Antwort-Interaktionen bereitzustellen.

Ein Cloud Run-Dienst ist ein skalierbarer API-Endpunkt für die Kernlogik Ihrer Anwendung. Es verwaltet mehrere gleichzeitige Nutzer effizient durch automatisches, bedarfsgesteuertes und schnelles Skalieren von Instanzen.

Architektur von KI-Agents in Cloud Run

Eine typische KI-Agent-Architektur, die in Cloud Run bereitgestellt wird, kann mehrere Komponenten von Google Cloud sowie außerhalb von Google Cloudumfassen:

Die vier Komponenten eines KI-Agents, der in Cloud Run gehostet wird. — **Abbildung 1.** Architektur eines KI-Agents in Cloud Run.

Das Diagramm zeigt Folgendes:

Hostingplattform: Cloud Run ist eine Hostingplattform zum Ausführen von Agents und bietet die folgenden Vorteile:
- Unterstützt die Ausführung eines beliebigen Agent-Frameworks zum Erstellen verschiedener Arten von Agenten und Agent-Architekturen. Beispiele für Agent-Frameworks sind das Agent Development Kit (ADK), Dify, LangGraph und n8n.
- Bietet integrierte Funktionen zum Verwalten Ihres Agents. Cloud Run bietet beispielsweise eine integrierte Dienstidentität, die Sie als Agent-Identität für den Aufruf von Google Cloud APIs mit sicheren und automatischen Anmeldedaten verwenden können.
- Unterstützt die Verbindung Ihres Agent-Frameworks mit anderen Diensten. Sie können Ihren Agent mit Erstanbieter- oder Drittanbietertools verbinden, die in Cloud Run bereitgestellt werden. Wenn Sie beispielsweise Einblick in die Aufgaben und Ausführungen Ihres Agents erhalten möchten, können Sie Tools wie Langfuse und Arize bereitstellen und verwenden.
Agent-Interaktionen: Cloud Run unterstützt Streaming von HTTP-Antworten an den Nutzer und WebSockets für Echtzeitinteraktionen.
GenAI-Modelle: Die Orchestrierungsebene ruft Modelle für Reasoning-Funktionen auf. Diese Modelle können auf Diensten wie den folgenden gehostet werden:
- Gemini API für generative KI-Modelle von Google.
- Vertex AI-Endpunkte für benutzerdefinierte Modelle oder andere Foundation Models.
- GPU-fähiger Cloud Run-Dienst für Ihre eigenen feinabgestimmten Modelle.
Speicher: Agenten benötigen oft Speicher, um den Kontext beizubehalten und aus vergangenen Interaktionen zu lernen. Sie können die folgenden Dienste verwenden:
- Memorystore for Redis für den Kurzzeitspeicher.
- Firestore für das Langzeitgedächtnis, z. B. zum Speichern des Unterhaltungsverlaufs oder zum Merken der Nutzereinstellungen auf Grundlage von Rohdaten.
- Vertex AI Agent Engine Memory Bank für langfristigen personalisierten Speicher. Bei dieser Funktion werden automatisch Informationen aus dem Unterhaltungsverlauf des Nutzers extrahiert, um die Einstellungen des Nutzers im Laufe der Zeit zu speichern und zu aktualisieren. Hinweis: Sie müssen mindestens eine Agent Engine-Instanz erstellen, um diese Funktion mit Cloud Run zu verwenden.
Vektordatenbank: Für Retrieval Augmented Generation (RAG) oder zum Abrufen strukturierter Daten können Sie eine Vektordatenbank verwenden, um bestimmte Informationen zu Entitäten abzufragen oder eine Vektorsuche für Einbettungen durchzuführen. Die pgvector-Erweiterung kann mit den folgenden Diensten verwendet werden:
- Cloud SQL for PostgreSQL
- AlloyDB for PostgreSQL
Tools:Der Orchestrator verwendet Tools, um bestimmte Aufgaben auszuführen und mit externen Diensten, APIs oder Websites zu interagieren. Beispiel:
- Model Context Protocol (MCP): Mit diesem standardisierten Protokoll können Sie mit externen Tools kommunizieren, die über einen MCP-Server ausgeführt werden.
- Einfache Dienstprogramme: Genaue mathematische Berechnungen, Zeitumrechnungen oder andere ähnliche Dienstprogramme.
- API-Aufrufe: Rufen Sie andere interne APIs oder APIs von Drittanbietern auf (Lese- oder Schreibzugriff).
- Bilder oder Diagramme erstellen: Visuelle Inhalte schnell und effektiv erstellen.
- Browser- und Betriebssystemautomatisierung: Führen Sie ein Headless- oder ein vollständiges grafisches Betriebssystem in Containerinstanzen aus, damit der Agent im Web surfen, Informationen von Websites extrahieren oder Aktionen durch Klicks und Tastatureingaben ausführen kann.
- Codeausführung: Code ausführen in einer sicheren Umgebung mit mehrschichtiger Sandbox-Technologie und minimalen oder keinen IAM-Berechtigungen.
- Codeausführung in Vertex AI Agent Engine: Führen Sie Code in sicheren, isolierten und verwalteten Sandbox-Umgebungen aus, die Datei-Ein- und -Ausgabe, Codeausführung in weniger als einer Sekunde und langlebigen Speicher unterstützen. Hinweis: Sie müssen mindestens eine Vertex AI Agent Engine-Instanz erstellen, um diese Funktion in Cloud Run verwenden zu können.

Nächste Schritte

Sehen Sie sich das Video KI-Agents in Cloud Run erstellen an.
Codelab zum Erstellen und Bereitstellen einer LangChain-App in Cloud Run
Informationen zum Bereitstellen des Agent Development Kit (ADK) in Cloud Run
Codelab zum Verwenden eines MCP-Servers in Cloud Run mit einem ADK-Agenten
Codelab zum Bereitstellen Ihres ADK-KI-Agenten in Cloud Run mit GPU
Gebrauchsfertige Agent-Beispiele finden Sie unter Agent Development Kit (ADK) – Beispiele.
MCP-Server (Model Context Protocol) in Cloud Run hosten

KI-Agents in Cloud Run hosten Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Anwendungsfälle für KI-Agents in Cloud Run

Architektur von KI-Agents in Cloud Run

Nächste Schritte

KI-Agents in Cloud Run hosten