Vertex AI Agent Engine – Übersicht

Vertex AI Agent Engine ist Teil der Vertex AI-Plattform und besteht aus einer Reihe von Diensten, mit denen Entwickler KI-Agenten in der Produktion bereitstellen, verwalten und skalieren können. Agent Engine verwaltet die Infrastruktur zum Skalieren von Agenten in der Produktion, sodass Sie sich auf die Entwicklung von Anwendungen konzentrieren können. Vertex AI Agent Engine bietet die folgenden Dienste, die Sie einzeln oder in Kombination verwenden können:

  • Laufzeit:

    • Agents bereitstellen und skalieren – mit einer verwalteten Runtime und End-to-End-Verwaltungsfunktionen.
    • Passen Sie das Container-Image des Agents mit Installationsskripts für Systemabhängigkeiten an, die zur Build-Zeit ausgeführt werden.
    • Verwenden Sie Sicherheitsfunktionen wie die VPC-SC-Compliance und die Konfiguration der Authentifizierung und von IAM.
    • Sie können auf Modelle und Tools wie Funktionsaufrufe zugreifen.
    • Stellen Sie Agents bereit, die mit verschiedenen Python-Frameworks und dem offenen Agent2Agent-Protokoll erstellt wurden.
  • Qualität und Bewertung (Vorschau): Bewerten Sie die Qualität von Agents mit dem integrierten Gen AI Evaluation Service und optimieren Sie Agents mit Trainingsläufen für Gemini-Modelle.

  • Example Store (Vorschau): Speichern und rufen Sie dynamisch Few-Shot-Beispiele ab, um die Leistung von Agenten zu verbessern.

  • Sitzungen (Vorabversion): Mit Agent Engine-Sitzungen können Sie einzelne Interaktionen zwischen Nutzern und Agenten speichern und so definitive Quellen für den Unterhaltungskontext bereitstellen.

  • Memory Bank (Vorabversion): Mit der Agent Engine Memory Bank können Sie Informationen aus Sitzungen speichern und abrufen, um Agent-Interaktionen zu personalisieren.

  • Codeausführung (Vorabversion): Mit der Agent Engine-Codeausführung kann Ihr Agent Code in einer sicheren, isolierten und verwalteten Sandbox-Umgebung ausführen.

  • Beobachtbarkeit: Das Verhalten von Agents lässt sich mit Google Cloud Trace (Unterstützung von OpenTelemetry), Cloud Monitoring und Cloud Logging nachvollziehen.

  • Governance: Vertex AI Agent Engine unterstützt mehrere Funktionen, mit denen Sie Agenten in der Produktion verwalten und Ihre Sicherheits- und Unternehmensanforderungen erfüllen können:

    • Bedrohungen mit Security Command Center erkennen: Agent Engine Threat Detection (Vorabversion) ist ein integrierter Dienst von Security Command Center, mit dem Sie potenzielle Angriffe auf Agents erkennen und untersuchen können, die in der Vertex AI Agent Engine-Laufzeitumgebung bereitgestellt werden.

    • Agent-Identität (Vorabversion): Verwenden Sie die IAM-Agent-Identität, um Sicherheits- und Zugriffsverwaltungsfunktionen zu nutzen, wenn Sie Agents in der Vertex AI Agent Engine-Laufzeit verwenden.

Vertex AI Agent Engine – konzeptionelle Übersicht

Vertex AI Agent Engine ist Teil von Vertex AI Agent Builder, einer Reihe von Funktionen zum Entdecken, Erstellen und Bereitstellen von KI-Agents.

KI-Agenten mit Vertex AI Agent Engine erstellen und bereitstellen

Hinweis:Wenn Sie eine optimierte IDE-basierte Entwicklung und Bereitstellung mit Vertex AI Agent Engine wünschen, sollten Sie das Agent-Starter-Pack in Betracht ziehen. Sie bietet sofort einsatzbereite Vorlagen, eine integrierte Benutzeroberfläche für Tests und vereinfacht Bereitstellung, Betrieb, Bewertung, Anpassung und Beobachtbarkeit.

Der Workflow zum Erstellen eines KI-Agents in Vertex AI Agent Engine sieht so aus:

Schritte Beschreibung
1. Umgebung einrichten Richten Sie Ihr Google-Projekt ein und installieren Sie die neueste Version des Vertex AI SDK für Python.
2. Agent entwickeln Entwickeln Sie einen Agenten, der in Vertex AI Agent Engine bereitgestellt werden kann.
3. Agent bereitstellen Stellen Sie den Agent in der verwalteten Laufzeit von Vertex AI Agent Engine bereit.
4. Agent verwenden Senden Sie eine API-Anfrage, um den Agenten zu fragen.
5. Bereitgestellten Agent verwalten In Vertex AI Agent Engine bereitgestellte KI-Agents verwalten und löschen

Die Schritte werden im folgenden Diagramm veranschaulicht:

Agent erstellen und bereitstellen 

Unterstützte Frameworks

In der folgenden Tabelle wird der Grad der Unterstützung beschrieben, den Vertex AI Agent Engine für verschiedene Agent-Frameworks bietet:

Supportstufe Frameworks für KI-Agenten
Benutzerdefiniertes Template: Sie können ein benutzerdefiniertes Template anpassen, um die Bereitstellung in Vertex AI Agent Engine über Ihr Framework zu unterstützen. CrewAI, benutzerdefinierte Frameworks
Vertex AI SDK-Integration: Vertex AI Agent Engine bietet verwaltete Vorlagen pro Framework im Vertex AI SDK und in der Dokumentation. AG2, LlamaIndex
Vollständige Integration: Die Funktionen sind so integriert, dass sie im gesamten Framework, in Vertex AI Agent Engine und im gesamten Google Cloud Ökosystem funktionieren. Agent Development Kit (ADK), LangChain, LangGraph

Mit dem Agent Starter Pack in der Produktion bereitstellen

Das Agent Starter Pack ist eine Sammlung von produktionsbereiten Vorlagen für generative KI-Agents, die für Vertex AI Agent Engine entwickelt wurden. Das Starterpaket für KI-Agenten bietet Folgendes:

  • Vordefinierte Agent-Vorlagen:ReAct, RAG, Multi-Agent und andere Vorlagen.
  • Interaktiver Playground: Hier können Sie Ihren Agenten testen und mit ihm interagieren.
  • Automatisierte Infrastruktur: Nutzt Terraform für eine optimierte Ressourcenverwaltung.
  • CI/CD-Pipelines: Automatisierte Bereitstellungsworkflows, die Cloud Build nutzen.
  • Observability: Integrierte Unterstützung für Cloud Trace und Cloud Logging.

Erste Schritte finden Sie in der Kurzanleitung.

Anwendungsfälle

Weitere Informationen zu Vertex AI Agent Engine mit End-to-End-Beispielen finden Sie in den folgenden Ressourcen:

Anwendungsfall Beschreibung Links
Agenten erstellen, indem eine Verbindung zu öffentlichen APIs hergestellt wird Währungen umrechnen.

Erstellen Sie eine Funktion, die eine Verbindung zu einer Währungsaustauschanwendung herstellt, damit das Modell korrekte Antworten auf Anfragen wie „Wie hoch ist der Wechselkurs von Euro zu Dollar heute?“ liefert.
Vertex AI SDK für Python-Notebook – Einführung in das Erstellen und Bereitstellen eines Agents mit Vertex AI Agent Engine
Design eines Solarprojekts für eine Gemeinde

 Potenzielle Standorte ermitteln, relevante Behörden und Lieferanten suchen und Satellitenbilder und das Solarpotenzial von Regionen und Gebäuden prüfen, um den optimalen Standort für die Installation Ihrer Solarmodule zu finden.
Vertex AI SDK für Python-Notebook – Erstellen und Bereitstellen eines Google Maps API-Agents mit Vertex AI Agent Engine
Agents erstellen, indem eine Verbindung zu Datenbanken hergestellt wird Integration in AlloyDB und Cloud SQL for PostgreSQL Blogpost – LangChain in Vertex AI Agent Builder für AlloyDB und Cloud SQL for PostgreSQL

Vertex AI SDK für Python-Notebook – Bereitstellen einer RAG-Anwendung mit Cloud SQL for PostgreSQL in Vertex AI Agent Engine

Vertex AI SDK für Python-Notebook – Bereitstellen einer RAG-Anwendung mit AlloyDB for PostgreSQL in Vertex AI Agent Engine
Agents mit Tools erstellen, die auf Daten in Ihrer Datenbank zugreifen Vertex AI SDK für Python-Notebook – Bereitstellen eines Agents mit Vertex AI Agent Engine und MCP Toolbox for Databases
Strukturierte Datenspeicher mit natürlicher Sprache abfragen und analysieren Vertex AI SDK für Python-Notebook – Conversational Search Agent mit Vertex AI Agent Engine und RAG in Vertex AI Search erstellen
Grafikdatenbanken mit natürlicher Sprache abfragen und analysieren Blogpost – GenAI GraphRAG and AI agents using Vertex AI Agent Engine with LangChain and Neo4j
Vektorspeicher mit natürlicher Sprache abfragen und analysieren Blogpost – Simplify GenAI RAG with MongoDB Atlas and Vertex AI Agent Engine
Agenten mit dem Agent Development Kit erstellen Agenten mit dem Agent Development Kit erstellen und bereitstellen Agent Development Kit – Bereitstellung in Vertex AI Agent Engine
Mit dem Expressmodus Währungen umrechnen

Erstellen Sie eine Funktion, die eine Verbindung zu einer Währungsumrechnungs-App herstellt, damit das Modell korrekte Antworten auf Anfragen wie „Wie hoch ist der Wechselkurs von Euro zu Dollar heute?“ liefern kann, und stellen Sie sie in Agent Engine bereit, ohne dass die Abrechnung über den Vertex AI Express-Modus erfolgt.
Vertex AI SDK für Python-Notebook – In Vertex AI Express-Modus in Vertex AI Agent Engine bereitstellen
Kontext mit Vertex AI Agent Engine Sessions und Memory Bank im Express-Modus von Vertex AI ohne Abrechnung verwalten. Agent Development Kit – Vertex AI Agent Engine-Sitzungen und Speicherbank im Express-Modus von Vertex AI.
Agenten mit OSS-Frameworks erstellen Mit dem Open-Source-Framework OneTwo können Sie Agents erstellen und bereitstellen. Blogpost – OneTwo und Vertex AI Agent Engine: Entwicklung fortschrittlicher KI-Agenten auf Google Cloud
Mit dem Open-Source-Framework LangGraph können Sie Agents erstellen und bereitstellen. Vertex AI SDK für Python-Notebook – Erstellen und Bereitstellen einer LangGraph-Anwendung mit Vertex AI Agent Engine
Agents debuggen und optimieren Mit OpenTelemetry und Cloud Trace können Sie Agenten erstellen und für sie Tracing ausführen. Vertex AI SDK für Python-Notebook – Debugging und Optimieren von Agents: Eine Anleitung zum Tracing in Vertex AI Agent Engine
Multi-Agenten-Systeme mit dem A2A-Protokoll erstellen (Vorabversion) Interoperable Agents entwickeln, die unabhängig von ihrem Framework mit anderen Agents kommunizieren und zusammenarbeiten können. Weitere Informationen finden Sie in der Dokumentation zum A2A-Protokoll.

Unternehmenssicherheit

Vertex AI Agent Engine unterstützt mehrere Funktionen, mit denen Sie die Sicherheitsanforderungen von Unternehmen erfüllen, die Sicherheitsrichtlinien Ihrer Organisation einhalten und Best Practices für die Sicherheit befolgen können. Die folgenden Funktionen werden unterstützt:

  • VPC Service Controls: Vertex AI Agent Engine unterstützt VPC Service Controls, um die Datensicherheit zu erhöhen und das Risiko einer Daten-Exfiltration zu verringern. Wenn VPC Service Controls konfiguriert ist, behält der bereitgestellte Agent den sicheren Zugriff auf Google APIs und ‑Dienste wie die BigQuery API, die Cloud SQL Admin API und die Vertex AI API bei. So wird ein reibungsloser Betrieb innerhalb des von Ihnen definierten Perimeters gewährleistet. VPC Service Controls blockiert effektiv den gesamten öffentlichen Internetzugriff und beschränkt die Datenübertragung auf Ihre autorisierten Netzwerkbereiche. Dadurch wird die Sicherheit Ihres Unternehmens erheblich verbessert.

  • Private Service Connect-Schnittstelle: Für die Vertex AI Agent Engine Runtime ermöglicht die PSC-I Ihren Agents, mit privat gehosteten Diensten in der VPC eines Nutzers zu interagieren. Weitere Informationen finden Sie unter Private Service Connect-Schnittstelle mit Vertex AI Agent Engine verwenden.

  • Vom Kunden verwaltete Verschlüsselungsschlüssel (Customer-Managed Encryption Keys, CMEK): Vertex AI Agent Engine unterstützt CMEK, um Ihre Daten mit Ihren eigenen Verschlüsselungsschlüsseln zu schützen. So haben Sie die Inhaberschaft und vollständige Kontrolle über die Schlüssel, die Ihre ruhenden Daten in Google Cloudschützen. Weitere Informationen finden Sie unter CMEK für Agent Engine.

  • Datenstandort: Vertex AI Agent Engine unterstützt den Datenstandort, um sicherzustellen, dass alle ruhenden und aktiven Daten in der angegebenen Region gespeichert werden.

  • HIPAA: Als Teil der Vertex AI Platform unterstützt Vertex AI Agent Engine HIPAA-Arbeitslasten.

  • Access Transparency: Mit Access Transparency erhalten Sie Logs, in denen die Aktionen erfasst werden, die Google-Mitarbeiter beim Zugriff auf Ihre Inhalte ausführen. Weitere Informationen zum Aktivieren von Access Transparency für Vertex AI Agent Engine finden Sie unter Access Transparency in Vertex AI.

In der folgenden Tabelle sehen Sie, welche Sicherheitsfunktionen für Unternehmen für die einzelnen Agent Engine-Dienste unterstützt werden:

Sicherheitsfunktion Laufzeit Sitzungen Memory Bank Example Store Codeausführung
VPC Service Controls Ja Ja Ja Nein Nein
Kundenverwaltete Verschlüsselungsschlüssel Ja Ja Ja Nein Nein
Datenstandort (DRZ) im Ruhezustand Ja Ja Ja Nein Nein
Datenstandort (DRZ) in Verwendung Nein Ja Ja* Nein Ja
HIPAA Ja Ja Ja Ja Nein
Access Transparency Ja Ja Ja Nein Nein

* Nur bei Verwendung eines regionalen Gemini-Endpunkts.

Unterstützung für den Expressmodus

Die Vertex AI Agent Engine unterstützt Vertex AI im Express-Modus. So können Sie die Vertex AI Agent Engine verwenden, ohne ein Google Cloud -Projekt zu erstellen.

Im Expressmodus unterstützt Vertex AI Agent Engine Folgendes:

  • (Kostenloses oder kostenpflichtiges Abo) Während der clientseitigen Entwicklung Ihres Agents können Sie mit dem Expressmodus von Vertex AI über einen API-Schlüssel auf Modelle aus Vertex AI Studio zugreifen.

  • (Kostenloses oder kostenpflichtiges Abo) Im Express-Modus können Sie eine ReasoningEngine-Instanz erstellen, mit der Sie die Dienste Session und Memory Bank nutzen können.

  • Sie können einen Agent in Vertex AI Agent Engine bereitstellen, indem Sie eine der folgenden Methoden verwenden:

    • (Kostenloses oder kostenpflichtiges Abo) Aus Quelldateien: Stellen Sie Ihren Agent direkt aus lokalem Quellcode bereit, ohne einen Cloud Storage-Bucket zu verwenden.

    • (Nur kostenpflichtiges Abo) Über ein Agent-Objekt: Sie müssen die Abrechnung in Ihrem Konto im Express-Modus aktivieren. Das liegt daran, dass für die Bereitstellung über ein Agent-Objekt ein Cloud Storage-Bucket zum Speichern von Agent-Code und ‑Artefakten erforderlich ist und für Cloud Storage der Express-Modus mit Abrechnung erforderlich ist.

Unterstützte Regionen

Eine Liste der unterstützten Regionen für die Vertex AI Agent Engine finden Sie unter Standorte.

Kontingent

Informationen zu Kontingenten für Vertex AI Agent Engine finden Sie unter Kontingente und Systemlimits.

Preise

Für die Vertex AI Agent Engine Runtime ist ein kostenloses Kontingent verfügbar.

Informationen zu den Preisen für die Agent Engine-Laufzeit finden Sie unter Vertex AI-Preise.

Migration zum clientbasierten SDK

Das Modul agent_engines im Vertex AI SDK für Python wird aus den folgenden wichtigen Gründen in ein clientbasiertes Design umgestaltet:

  • Um die kanonischen Typdarstellungen an das Google ADK und das Google Gen AI SDK anzupassen. So wird sichergestellt, dass Datentypen in verschiedenen SDKs einheitlich und standardisiert dargestellt werden. Das vereinfacht die Interoperabilität und reduziert den Konvertierungsaufwand.
  • Für die Festlegung des Bereichs von Google Cloud Parametern auf Clientebene in Anwendungen mit mehreren Projekten und Standorten. So kann eine Anwendung Interaktionen mit Ressourcen in verschiedenen Google Cloud Projekten und geografischen Standorten verwalten, indem jede Clientinstanz mit den spezifischen Projekt- und Standorteinstellungen konfiguriert wird.
  • Um die Auffindbarkeit und Kohäsion von Vertex AI Agent Engine-Diensten zu verbessern

Nächste Schritte