Auf dieser Seite wird beschrieben, wie Sie Agents verwalten, die in der verwalteten Laufzeit von Vertex AI Agent Engine bereitgestellt wurden. Bereitgestellte Agents sind Ressourcen vom Typ reasoningEngine in Vertex AI.
Bereitgestellte Agents auflisten
Alle bereitgestellten Agents für ein bestimmtes Projekt und einen bestimmten Standort auflisten:
Console
- Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.
Bereitgestellte Agents, die Teil des ausgewählten Projekts sind, werden in der Liste angezeigt. Mit dem Feld Filtern können Sie die Liste nach der von Ihnen angegebenen Spalte filtern.
Vertex AI SDK für Python
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
for agent in client.agent_engines.list():
print(agent)
So filtern Sie die Liste nach display_name:
for agent in client.agent_engines.list(
config={
"filter": 'display_name="DISPLAY_NAME"',
},
):
print(agent)
REST
Rufen Sie die Methode reasoningEngines.list auf.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
PROJECT_ID: ID Ihres GCP-ProjektsLOCATION: eine unterstützte Region
HTTP-Methode und URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.
Vertex AI Express-Modus
Sie können entweder das Vertex AI SDK für Python oder REST mit dem Vertex AI-Expressmodus verwenden. Weitere Informationen zum Express-Modus von Vertex AI und eine Anleitung zur Registrierung finden Sie in der Übersicht zu Vertex AI im Express-Modus.
Vertex AI SDK
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
for agent in client.agent_engines.list():
print(agent)
Ersetzen Sie API_KEY durch Ihren API-Schlüssel für den Express-Modus.
So filtern Sie die Liste nach display_name:
for agent in client.agent_engines.list(
config={
"filter": 'display_name="DISPLAY_NAME"',
},
):
print(agent)
REST API
Mit dem folgenden REST-Befehl wird die Methode reasoningEngines.list aufgerufen:
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
API_KEY: Ihr API-Schlüssel für den Express-Modus
HTTP-Methode und URL:
GET https://aiplatform.googleapis.com/v1/projects/reasoningEngines?key=API_KEY
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.
Bereitgestellten Agent abrufen
Jeder bereitgestellte Agent hat eine eindeutige RESOURCE_ID-ID.
Weitere Informationen finden Sie unter Agent bereitstellen.
Console
- Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.
Bereitgestellte Agents, die Teil des ausgewählten Projekts sind, werden in der Liste angezeigt. Mit dem Feld Filtern können Sie die Liste nach der von Ihnen angegebenen Spalte filtern.
Klicken Sie auf den Namen des angegebenen Agents. Die Seite Messwerte für den Agenten wird geöffnet.
Optional: Wenn Sie sich die Bereitstellungsdetails für den Agent ansehen möchten, klicken Sie auf Bereitstellungsdetails. Der Bereich Bereitstellungsdetails wird geöffnet. Klicken Sie auf Fertig, um den Bereich zu schließen.
Optional: Wenn Sie die
query- undstreamQuery-URLs für den Agent ansehen möchten, klicken Sie auf API-URLs. Der Bereich API-URLs wird geöffnet. Klicken Sie auf Fertig, um den Bereich zu schließen.
Vertex AI SDK für Python
Mit dem folgenden Code können Sie einen bestimmten bereitgestellten Agent abrufen:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
remote_agent = client.agent_engines.get(
name="projects/PROJECT_ID_OR_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)
REST
Rufen Sie die Methode reasoningEngines.get auf.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
PROJECT_ID: ID Ihres GCP-ProjektsLOCATION: eine unterstützte RegionRESOURCE_ID: die Ressourcen-ID des bereitgestellten Agents
HTTP-Methode und URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.
Vertex AI Express-Modus
Sie können entweder das Vertex AI SDK für Python oder REST mit dem Vertex AI-Expressmodus verwenden. Weitere Informationen zum Express-Modus von Vertex AI und eine Anleitung zur Registrierung finden Sie in der Übersicht zu Vertex AI im Express-Modus.
Vertex AI SDK
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
remote_agent = client.agent_engines.get(
name="RESOURCE_NAME"
)
# Resource Name: "projects/{PROJECT_NUMBER}/locations/{LOCATION}/reasoningEngines/{RESOURCE_ID}"
# RESOURCE_ID can be used for the REST commands
Ersetzen Sie API_KEY durch Ihren API-Schlüssel für den Express-Modus.
REST API
Mit dem folgenden REST-Befehl wird die Methode reasoningEngines.get aufgerufen:
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
RESOURCE_ID: die Ressourcen-ID des bereitgestellten AgentsAPI_KEY: Ihr API-Schlüssel für den Express-Modus
HTTP-Methode und URL:
GET https://aiplatform.googleapis.com/v1/reasoningEngines/RESOURCE_ID?key=API_KEY
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.
Bereitgestellten Agent aktualisieren
Sie können ein oder mehrere Felder des bereitgestellten Agents gleichzeitig aktualisieren. Sie müssen jedoch mindestens eines der zu aktualisierenden Felder angeben. Wie lange die Aktualisierung des bereitgestellten Agents dauert, hängt vom durchgeführten Update ab. In der Regel sollte sie jedoch nur wenige Sekunden bis Minuten in Anspruch nehmen.
Console
- Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.
Klicken Sie für den angegebenen Agent auf das Dreipunkt-Menü .
Klicken Sie auf Bearbeiten. Der Bereich Bearbeiten für den Agent wird geöffnet.
Bearbeiten Sie den Anzeigenamen oder die Beschreibung des Agents.
Klicken Sie auf Speichern.
Vertex AI SDK für Python
So aktualisieren Sie einen bereitgestellten Agenten (entsprechend RESOURCE_NAME) auf einen aktualisierten Agenten (entsprechend UPDATED_AGENT):
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
client.agent_engines.update(
name=RESOURCE_NAME, # Required.
agent=UPDATED_AGENT, # Optional.
config={ # Optional.
"requirements": REQUIREMENTS, # Optional.
"display_name": "DISPLAY_NAME", # Optional.
"description": "DESCRIPTION", # Optional.
"extra_packages": EXTRA_PACKAGES, # Optional.
},
)
Die Argumente sind dieselben wie bei der Bereitstellung eines Agents.
REST
Rufen Sie die Methode reasoningEngines.patch auf und geben Sie einen update_mask an, um festzulegen, welche Felder aktualisiert werden sollen.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
PROJECT_ID: ID Ihres GCP-ProjektsLOCATION: eine unterstützte RegionRESOURCE_ID: die Ressourcen-ID des bereitgestellten Agentsupdate_mask: eine Liste durch Kommas getrennter Felder, die aktualisiert werden sollen
HTTP-Methode und URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"
JSON-Text anfordern:
{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.
Vertex AI Express-Modus
Sie können entweder das Vertex AI SDK für Python oder REST mit dem Vertex AI-Expressmodus verwenden. Weitere Informationen zum Express-Modus von Vertex AI und eine Anleitung zur Registrierung finden Sie in der Übersicht zu Vertex AI im Express-Modus.
Vertex AI SDK
Im folgenden Code wird das Vertex AI SDK für Python verwendet, um einen bereitgestellten Agenten (entsprechend RESOURCE_NAME) auf einen aktualisierten Agenten (entsprechend UPDATED_AGENT) zu aktualisieren:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
client.agent_engines.update(
name=RESOURCE_NAME, # Required.
agent=UPDATED_AGENT, # Optional.
config={ # Optional.
"requirements": REQUIREMENTS, # Optional.
"display_name": "DISPLAY_NAME", # Optional.
"description": "DESCRIPTION", # Optional.
"extra_packages": EXTRA_PACKAGES, # Optional.
},
)
Ersetzen Sie API_KEY durch Ihren API-Schlüssel für den Express-Modus.
REST API
Mit dem folgenden REST-Befehl wird die Methode reasoningEngines.patch aufgerufen und ein update_mask angegeben, um festzulegen, welche Felder aktualisiert werden sollen:
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
RESOURCE_ID: die Ressourcen-ID des bereitgestellten AgentsAPI_KEY: Ihr API-Schlüssel für den Express-Modusupdate_mask: eine Liste durch Kommas getrennter Felder, die aktualisiert werden sollen
HTTP-Methode und URL:
PATCH https://aiplatform.googleapis.com/v1/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"&key=API_KEY
JSON-Text anfordern:
{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.
Telemetrie für den bereitgestellten Agenten konfigurieren
Wenn Sie während der Entwicklung des Agents Traces aktiviert haben, können Sie die Google Cloud Console verwenden, um die Telemetrie für Ihren bereitgestellten Agenten zu konfigurieren.
Telemetrie für bereitgestellte Agents mit aktivierter Telemetrie konfigurieren:
- Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.
Agent Engine-Instanzen, die Teil des ausgewählten Projekts sind, werden in der Liste angezeigt. Mit dem Feld Filtern können Sie die Liste nach der von Ihnen angegebenen Spalte filtern.
Suchen Sie die Zeile für Ihre Agent Engine-Instanz. Klicken Sie in der Spalte Telemetriekonfiguration auf Konfigurieren. Der Bereich Dienstkonfiguration wird geöffnet.
Sie können die folgenden Konfigurationen vornehmen:
Beobachtbarkeit: Sie können Folgendes konfigurieren:
Instrumentierung von OpenTelemetry-Traces und ‑Logs aktivieren: Klicken Sie auf die Ein/Aus-Schaltfläche, um das Dashboard zur Beobachtbarkeit des KI-Agenten und die Seiten für Traces zu füllen.
Logging von Prompt-Eingaben und Antwortausgaben aktivieren: Wenn Sie die vollständigen Inhalte von Prompts und Antworten der Nutzer erfassen und speichern möchten, klicken Sie auf den Schalter, um ihn zu aktivieren.
Wenn die Telemetrieerfassung für Ihren Agent deaktiviert ist, müssen Sie Ihren Agent neu bereitstellen und Ihre Vertex AI SDK-Version auf
>= 1.126.1aktualisieren, um Konfigurationsoptionen für Observability aufzurufen.Container: Konfigurieren Sie die Containereinstellungen für Ihren bereitgestellten Agent:
Skalierung: Geben Sie eine Mindestanzahl von Instanzen und eine maximale Anzahl von Instanzen ein.
Ressourcen: Wählen Sie für jeden Container Limits für Arbeitsspeicher und CPU aus.
Container-Nebenläufigkeit: Geben Sie eine Mindestanzahl von Instanzen ein, um die Nebenläufigkeit für jeden Container und KI-Agentenserver festzulegen. Der empfohlene Wert ist (2 × CPU + 1) und der Standardwert ist 9.
Zugriff und Berechtigungen: Klicken Sie auf Berechtigungen in IAM verwalten, um die Berechtigungen für KI-Agenten für das zugehörige Dienstkonto zu verwalten.
Bereitstellungsdetails: Hier können Sie die Bereitstellungsdetails für den Agent ansehen, einschließlich Ressourcenname und Anzeigename.
Memory Bank: Hier finden Sie Details zur Memory Bank des Agents, einschließlich Memory Generation und Memory Search.
Klicken Sie auf Aktualisieren oder Schließen.
Messwerte für den bereitgestellten Agenten ansehen
Für bereitgestellte Agents können Sie in der Console Messwerte für Ihren Agent aufrufen:
- Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.
Bereitgestellte Agents, die Teil des ausgewählten Projekts sind, werden in der Liste angezeigt. Mit dem Feld Filtern können Sie die Liste nach der von Ihnen angegebenen Spalte filtern.
Klicken Sie auf den Namen Ihres Agents. Das Dashboard für den ausgewählten Agent wird angezeigt.
Wählen Sie einen der folgenden Tabs Dashboard aus:
Übersicht: Hier finden Sie ein zusammenfassendes Dashboard mit Messwerten für Ihren Agenten, darunter die Agenten-Latenz, die Anzahl der Agenten-Anfragen und die Agenten-Fehlerrate.
Modelle: Hier sehen Sie ein Dashboard mit Messwerten für das Modell Ihres Agents, einschließlich der Anzahl der Modellaufrufe, der Fehlerrate des Modells und der Modell-Token-Nutzung.
Tools: Hier sehen Sie ein Dashboard mit Messwerten für die Tools Ihres Agenten, darunter die Anzahl der Tool-Aufrufe, die Tool-Fehlerrate und die Tool-Latenz.
Nutzung: Hier finden Sie ein Dashboard mit Messwerten zur Nutzung Ihres Agents, einschließlich der Token-Nutzung nach Ein- und Ausgabe, der CPU-Zuweisung für Container und der Speicherzuweisung für Container.
Logs: Hier können Sie die Logs Ihres Agents ansehen, wenn Sie Cloud Logging für Ihren Agent aktiviert haben.

Bereitgestellten Agent löschen
Einen bereitgestellten Agent aus der verwalteten Laufzeit von Vertex AI Agent Engine löschen
Console
- Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.
Klicken Sie für den angegebenen Agent auf das Dreipunkt-Menü .
Klicken Sie auf Löschen.
Klicken Sie auf Agent löschen.
Vertex AI SDK für Python
Wenn Sie bereits eine vorhandene Instanz des bereitgestellten Agents (als remote_agent) haben, können Sie den folgenden Befehl ausführen:
remote_agent.delete(
force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)
Alternativ können Sie agent_engines.delete() aufrufen, um den bereitgestellten Agenten zu löschen, der RESOURCE_NAME entspricht:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
client.agent_engines.delete(
name=RESOURCE_NAME,
force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)
REST
Rufen Sie die Methode reasoningEngines.delete auf.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
PROJECT_ID: ID Ihres GCP-ProjektsLOCATION: eine unterstützte RegionRESOURCE_ID: die Ressourcen-ID des bereitgestellten Agents
HTTP-Methode und URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.
Vertex AI Express-Modus
Sie können entweder das Vertex AI SDK für Python oder REST mit dem Vertex AI-Expressmodus verwenden.
Vertex AI SDK
Im folgenden Code wird das Vertex AI SDK für Python verwendet, um den bereitgestellten Agenten zu löschen, der RESOURCE_NAME entspricht:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
client.agent_engines.delete(
name=RESOURCE_NAME,
force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)
Ersetzen Sie API_KEY durch Ihren API-Schlüssel für den Express-Modus.
REST API
Mit dem folgenden REST-Befehl wird die Methode reasoningEngines.delete aufgerufen:
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
RESOURCE_ID: die Ressourcen-ID des bereitgestellten AgentsAPI_KEY: Ihr API-Schlüssel für den Express-Modus
HTTP-Methode und URL:
DELETE https://aiplatform.googleapis.com/v1/projects/reasoningEngines/RESOURCE_ID?key=API_KEY
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.