Bereitstgestellte Kundenservicemitarbeiter verwalten

Auf dieser Seite wird beschrieben, wie Sie Agenten verwalten, die in der verwalteten Laufzeit von Vertex AI Agent Engine bereitgestellt wurden. Bereitgestellte Agents sind Ressourcen vom Typ reasoningEngine in Vertex AI.

Bereitgestellte KI-Agenten auflisten

Alle bereitgestellten KI-Agents für ein bestimmtes Projekt und einen bestimmten Standort auflisten:

Console

Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.

Zu Agent Engine

Bereitgestellte Agents, die Teil des ausgewählten Projekts sind, werden in der Liste angezeigt. Mit dem Feld Filter können Sie die Liste nach der von Ihnen angegebenen Spalte filtern.

Vertex AI SDK für Python

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

for agent in client.agent_engines.list():
    print(agent)

So filtern Sie die Liste nach display_name:

for agent in client.agent_engines.list(
    config={
        "filter": 'display_name="DISPLAY_NAME"',
    },
):
    print(agent)

REST

Rufen Sie die Methode reasoningEngines.list auf.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: ID Ihres GCP-Projekts
LOCATION: eine unterstützte Region

HTTP-Methode und URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:

curl (Linux, macOS oder Cloud Shell)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt haben, die Sie automatisch in der gcloud-Befehlszeile anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Führen Sie folgenden Befehl aus:

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines"

PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Führen Sie folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines" | Select-Object -Expand Content

Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.

Bereitgestellten Agent abrufen

Jeder bereitgestellte KI-Agent hat eine eindeutige RESOURCE_ID-ID. Weitere Informationen finden Sie unter Agent bereitstellen.

Console

Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.

Zu Agent Engine

Bereitgestellte Agents, die Teil des ausgewählten Projekts sind, werden in der Liste angezeigt. Mit dem Feld Filtern können Sie die Liste nach der von Ihnen angegebenen Spalte filtern.
Klicken Sie auf den Namen des angegebenen Agents. Die Seite Messwerte für den Agenten wird geöffnet.
Optional: Wenn Sie sich die Bereitstellungsdetails für den Agent ansehen möchten, klicken Sie auf Bereitstellungsdetails. Der Bereich Bereitstellungsdetails wird geöffnet. Klicken Sie auf Fertig, um den Bereich zu schließen.
Optional: Wenn Sie die query- und streamQuery-URLs für den Agent ansehen möchten, klicken Sie auf API-URLs. Der Bereich API-URLs wird geöffnet. Klicken Sie auf Fertig, um den Bereich zu schließen.

Vertex AI SDK für Python

Mit dem folgenden Code können Sie einen bestimmten bereitgestellten Agent abrufen:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

remote_agent = client.agent_engines.get(
    name="projects/PROJECT_ID_OR_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

Rufen Sie die Methode reasoningEngines.get auf.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: ID Ihres GCP-Projekts
LOCATION: eine unterstützte Region
RESOURCE_ID: die Ressourcen-ID des bereitgestellten Agenten

HTTP-Methode und URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:

curl (Linux, macOS oder Cloud Shell)

Führen Sie folgenden Befehl aus:

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Führen Sie folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.

Bereitgestellten Agent aktualisieren

Sie können ein oder mehrere Felder des bereitgestellten Agents gleichzeitig aktualisieren. Sie müssen jedoch mindestens eines der zu aktualisierenden Felder angeben. Wie lange die Aktualisierung des bereitgestellten Agents dauert, hängt vom durchgeführten Update ab. In der Regel sollte sie jedoch nur wenige Sekunden bis Minuten in Anspruch nehmen.

Console

Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.

Zu Agent Engine
Klicken Sie für den angegebenen KI-Agent auf das Dreipunkt-Menü .
Klicken Sie auf Bearbeiten. Der Bereich Bearbeiten für den Agent wird geöffnet.
Bearbeiten Sie den Anzeigenamen oder die Beschreibung des Agents.
Klicken Sie auf Speichern.

Vertex AI SDK für Python

So aktualisieren Sie einen bereitgestellten Agenten (entsprechend RESOURCE_NAME) auf einen aktualisierten Agenten (entsprechend UPDATED_AGENT):

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.update(
    name=RESOURCE_NAME,                    # Required.
    agent=UPDATED_AGENT,                   # Optional.
    config={                                                # Optional.
        "requirements": REQUIREMENTS,      # Optional.
        "display_name": "DISPLAY_NAME",    # Optional.
        "description": "DESCRIPTION",      # Optional.
        "extra_packages": EXTRA_PACKAGES,  # Optional.
    },
)

Die Argumente sind dieselben wie bei der Bereitstellung eines Agents.

REST

Rufen Sie die Methode reasoningEngines.patch auf und geben Sie einen update_mask an, um festzulegen, welche Felder aktualisiert werden sollen.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: ID Ihres GCP-Projekts
LOCATION: eine unterstützte Region
RESOURCE_ID: die Ressourcen-ID des bereitgestellten Agenten
update_mask: eine Liste durch Kommas getrennter Felder, die aktualisiert werden sollen

HTTP-Methode und URL:

PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"

JSON-Text anfordern:

{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}

Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:

curl (Linux, macOS oder Cloud Shell)

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X PATCH \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description""

PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method PATCH `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"" | Select-Object -Expand Content

Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.

Telemetrie für den bereitgestellten Agenten konfigurieren

Wenn Sie während der Entwicklung des Agents Traces aktiviert haben, können Sie die Google Cloud Console verwenden, um die Telemetrie für Ihren bereitgestellten Agent zu konfigurieren.

Telemetrie für bereitgestellte Agents mit aktivierter Telemetrie konfigurieren:

Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.

Zu Agent Engine

Agent Engine-Instanzen, die Teil des ausgewählten Projekts sind, werden in der Liste angezeigt. Mit dem Feld Filter können Sie die Liste nach der von Ihnen angegebenen Spalte filtern.
Suchen Sie die Zeile für Ihre Agent Engine-Instanz. Klicken Sie in der Spalte Telemetriekonfiguration auf Konfigurieren. Der Bereich Dienstkonfiguration wird geöffnet.
Sie können die folgenden Konfigurationen vornehmen:
- Beobachtbarkeit: Sie können Folgendes konfigurieren:
  - Instrumentierung von OpenTelemetry-Traces und ‑Logs aktivieren: Klicken Sie auf die Ein/Aus-Schaltfläche, um das Dashboard zur Beobachtbarkeit des KI-Agenten und die Seiten für Traces zu füllen.
  - Logging von Prompt-Eingaben und Antwortausgaben aktivieren: Wenn Sie die vollständigen Inhalte von Prompts und Antworten der Nutzer erfassen und speichern möchten, klicken Sie auf den Schalter, um ihn zu aktivieren.
  Wenn die Telemetrieerfassung für Ihren Agent deaktiviert ist, müssen Sie Ihren Agent neu bereitstellen und Ihre Vertex AI SDK-Version auf >= 1.126.1 aktualisieren, um Konfigurationsoptionen für Observability aufzurufen.
- Container: Konfigurieren Sie die Containereinstellungen für Ihren bereitgestellten Agent:
  - Skalierung: Geben Sie eine Mindestanzahl von Instanzen und eine maximale Anzahl von Instanzen ein.
  - Ressourcen: Wählen Sie für jeden Container Limits für Arbeitsspeicher und CPU aus.
  - Container-Nebenläufigkeit: Geben Sie eine Mindestanzahl von Instanzen ein, um die Nebenläufigkeit für jeden Container und KI-Agentenserver festzulegen. Der empfohlene Wert ist (2 × CPU + 1) und der Standardwert ist 9.
- Zugriff und Berechtigungen: Klicken Sie auf Berechtigungen in IAM verwalten, um die Berechtigungen für den KI-Agenten für das zugehörige Dienstkonto zu verwalten.
- Bereitstellungsdetails: Hier können Sie die Bereitstellungsdetails für den Agent ansehen, einschließlich Ressourcenname und Anzeigename.
- Memory Bank: Hier finden Sie Details zur Memory Bank des Agents, einschließlich Memory Generation und Memory Search.
Klicken Sie auf Aktualisieren oder Schließen.

Messwerte für den bereitgestellten Agenten ansehen

Für bereitgestellte Agents können Sie in der Console Messwerte für Ihren Agent ansehen:

Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.

Zu Agent Engine

Bereitgestellte Agents, die Teil des ausgewählten Projekts sind, werden in der Liste angezeigt. Mit dem Feld Filter können Sie die Liste nach der von Ihnen angegebenen Spalte filtern.
Klicken Sie auf den Namen Ihres Agents. Das Dashboard für den ausgewählten Agent wird angezeigt.
Wählen Sie einen der folgenden Tabs Dashboard aus:
- Übersicht: Hier sehen Sie ein zusammenfassendes Dashboard mit Messwerten für Ihren Agent, darunter Agent-Latenz, Anzahl der Agent-Anfragen und Fehlerrate des Agents.
- Modelle: Hier sehen Sie ein Dashboard mit Messwerten für das Modell Ihres Agents, einschließlich der Anzahl der Modellaufrufe, der Fehlerrate des Modells und der Tokennutzung des Modells.
- Tools: Hier sehen Sie ein Dashboard mit Messwerten für die Tools Ihres KI-Agents, darunter die Anzahl der Tool-Aufrufe, die Tool-Fehlerrate und die Tool-Latenz.
- Nutzung: Hier finden Sie ein Dashboard mit Messwerten zur Nutzung Ihres Agents, einschließlich der Token-Nutzung nach Ein- und Ausgabe, der CPU-Zuweisung für Container und der Speicherzuweisung für Container.
- Logs: Hier können Sie die Logs Ihres Agents ansehen, wenn Sie Cloud Logging für Ihren Agent aktiviert haben.

Vertex AI Agent Engine-Dashboard

Bereitgestellten Agent löschen

Einen bereitgestellten Agent aus der verwalteten Laufzeit von Vertex AI Agent Engine löschen

Console

Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Engine auf.

Zu Agent Engine
Klicken Sie für den angegebenen KI-Agent auf das Dreipunkt-Menü .
Klicken Sie auf Löschen.
Klicken Sie auf Agent löschen.

Vertex AI SDK für Python

Wenn Sie bereits eine vorhandene Instanz des bereitgestellten Agents (als remote_agent) haben, können Sie den folgenden Befehl ausführen:

remote_agent.delete(
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

Alternativ können Sie agent_engines.delete() aufrufen, um den bereitgestellten Agenten zu löschen, der RESOURCE_NAME entspricht:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.delete(
    name=RESOURCE_NAME,
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

REST

Rufen Sie die Methode reasoningEngines.delete auf.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: ID Ihres GCP-Projekts
LOCATION: eine unterstützte Region
RESOURCE_ID: die Ressourcen-ID des bereitgestellten Agenten

HTTP-Methode und URL:

DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:

curl (Linux, macOS oder Cloud Shell)

Führen Sie folgenden Befehl aus:

curl -X DELETE \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto in der gcloud-Befehlszeile angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Führen Sie folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method DELETE `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

Sie sollten einen erfolgreichen Statuscode (2xx) und eine leere Antwort als Ausgabe erhalten.

Bereitstgestellte Kundenservicemitarbeiter verwalten Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Bereitgestellte KI-Agenten auflisten

Console

Vertex AI SDK für Python

REST

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

Bereitgestellten Agent abrufen

Console

Vertex AI SDK für Python

REST

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

Bereitgestellten Agent aktualisieren

Console

Vertex AI SDK für Python

REST

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

Telemetrie für den bereitgestellten Agenten konfigurieren

Messwerte für den bereitgestellten Agenten ansehen

Bereitgestellten Agent löschen

Console

Vertex AI SDK für Python

REST

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

Nächste Schritte

Bereitstgestellte Kundenservicemitarbeiter verwalten