Gestionar agentes implementados

En esta página se describe cómo gestionar los agentes que se han desplegado en el tiempo de ejecución gestionado de Vertex AI Agent Engine. Los agentes desplegados son recursos de tipo reasoningEngine en Vertex AI.

Mostrar agentes implementados

Para ver todos los agentes implementados de un proyecto y una ubicación determinados, haz lo siguiente:

Consola

En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

Ir a Agent Engine

En la lista se muestran los agentes implementados que forman parte del proyecto seleccionado. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.

SDK de Vertex AI para Python

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

for agent in client.agent_engines.list():
    print(agent)

Para filtrar la lista por display_name, sigue estos pasos:

for agent in client.agent_engines.list(
    config={
        "filter": 'display_name="DISPLAY_NAME"',
    },
):
    print(agent)

REST

Llama al método reasoningEngines.list.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

PROJECT_ID: tu ID de proyecto de GCP
LOCATION: una región admitida

Método HTTP y URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

Para enviar tu solicitud, despliega una de estas opciones:

curl (Linux, macOS o Cloud Shell)

Nota: En el siguiente comando se presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login , o bien usando Cloud Shell, que inicia sesión automáticamente en la CLI de gcloud . Para comprobar la cuenta activa, ejecuta el comando gcloud auth list.

Ejecuta el comando siguiente:

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines"

PowerShell (Windows)

Nota: El siguiente comando presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login . Para comprobar la cuenta activa, ejecuta el comando gcloud auth list.

Ejecuta el comando siguiente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines" | Select-Object -Expand Content

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Obtener un agente desplegado

Cada agente implementado tiene un identificador RESOURCE_ID único. Para obtener más información, consulta Implementar un agente.

Consola

En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

Ir a Agent Engine

En la lista se muestran los agentes implementados que forman parte del proyecto seleccionado. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.
Haz clic en el nombre del agente especificado. Se abrirá la página Métricas del agente.
(Opcional) Para ver los detalles de la implementación del agente, haz clic en Detalles de la implementación. Se abrirá el panel Detalles de la implementación. Para cerrar el panel, haz clic en Hecho.
(Opcional) Para ver las URLs de query y streamQuery del agente, haz clic en URLs de API. Se abrirá el panel URLs de API. Para cerrar el panel, haz clic en Hecho.

SDK de Vertex AI para Python

El siguiente código te permite obtener un agente implementado específico:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

remote_agent = client.agent_engines.get(
    name="projects/PROJECT_ID_OR_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

Llama al método reasoningEngines.get.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

PROJECT_ID: tu ID de proyecto de GCP
LOCATION: una región admitida
RESOURCE_ID: el ID de recurso del agente implementado

Método HTTP y URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Para enviar tu solicitud, despliega una de estas opciones:

curl (Linux, macOS o Cloud Shell)

Ejecuta el comando siguiente:

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell (Windows)

Ejecuta el comando siguiente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Actualizar un agente implementado

Puedes actualizar uno o varios campos del agente implementado al mismo tiempo, pero debes especificar al menos uno de los campos que quieras actualizar. El tiempo que se tarda en actualizar el agente implementado depende de la actualización que se esté realizando, pero suele ser de unos segundos a unos minutos.

Consola

En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

Ir a Agent Engine
En el agente que hayas especificado, haz clic en el menú Más acciones ().
Haz clic en Editar. Se abrirá el panel Editar del agente.
Edita el Nombre visible o la Descripción del agente.
Haz clic en Guardar.

SDK de Vertex AI para Python

Para actualizar un agente implementado (correspondiente a RESOURCE_NAME) a un agente actualizado (correspondiente a UPDATED_AGENT), sigue estos pasos:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.update(
    name=RESOURCE_NAME,                    # Required.
    agent=UPDATED_AGENT,                   # Optional.
    config={                                                # Optional.
        "requirements": REQUIREMENTS,      # Optional.
        "display_name": "DISPLAY_NAME",    # Optional.
        "description": "DESCRIPTION",      # Optional.
        "extra_packages": EXTRA_PACKAGES,  # Optional.
    },
)

Los argumentos son los mismos que cuando despliegas un agente.

REST

Llama al método reasoningEngines.patch y proporciona un update_mask para especificar qué campos se van a actualizar.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

PROJECT_ID: tu ID de proyecto de GCP
LOCATION: una región admitida
RESOURCE_ID: el ID de recurso del agente implementado
update_mask: lista de campos separados por comas que se van a actualizar.

Método HTTP y URL:

PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"

Cuerpo JSON de la solicitud:

{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}

Para enviar tu solicitud, despliega una de estas opciones:

curl (Linux, macOS o Cloud Shell)

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X PATCH \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description""

PowerShell (Windows)

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method PATCH `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"" | Select-Object -Expand Content

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Configurar la telemetría del agente desplegado

Si habilitaste los rastreos durante el desarrollo del agente, puedes usar la consola Google Cloud para configurar la telemetría de tu agente implementado.

Configura la telemetría de los agentes implementados con la telemetría habilitada:

En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

Ir a Agent Engine

Las instancias de Agent Engine que forman parte del proyecto seleccionado aparecen en la lista. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.
Busca la fila de tu instancia de Agent Engine. En la columna Configuración de la telemetría, haga clic en Configurar. Se abrirá el panel Configuración del servicio.
Puedes hacer las siguientes configuraciones:
- Observabilidad: puedes configurar lo siguiente:
  - Habilita la instrumentación de trazas y registros de OpenTelemetry: para rellenar el panel de observabilidad del agente y las páginas de trazas, haz clic en el interruptor para activarlo.
  - Habilitar el registro de las entradas de las peticiones y las salidas de las respuestas: para recoger y almacenar el contenido completo de las peticiones y las respuestas de los usuarios, haz clic en el interruptor para activarlo.
  Si la recogida de telemetría está inhabilitada en tu agente, debes volver a implementar el agente y actualizar la versión del SDK de Vertex AI a >= 1.126.1 para ver las opciones de configuración de Observabilidad.
- Contenedores: configure los ajustes de los contenedores de su agente implementado:
  - Escalado: introduce un Número mínimo de instancias y un Número máximo de instancias.
  - Recursos: selecciona los límites de Memoria y CPU de cada contenedor.
  - Simultaneidad de contenedores: introduce un Número mínimo de instancias para definir la simultaneidad de cada contenedor y servidor de agente. El valor recomendado es (2 * CPU + 1) y el valor predeterminado es 9.
- Acceso y permisos: haz clic en Gestionar permisos en IAM para gestionar los permisos del agente en la cuenta de servicio asociada.
- Detalles del despliegue: consulta los detalles del despliegue del agente, como el nombre del recurso y el nombre visible.
- Banco de memoria: consulta los detalles del banco de memoria del agente, como la generación de memoria y la búsqueda en la memoria.
Haz clic en Actualizar o Cerrar.

Ver las métricas de un agente implementado

En el caso de los agentes implementados, puedes usar la consola para ver las métricas de tu agente:

En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

Ir a Agent Engine

En la lista se muestran los agentes implementados que forman parte del proyecto seleccionado. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.
Haz clic en el nombre de tu agente. Se muestra el panel de control del agente seleccionado.
Seleccione una de las siguientes pestañas de Panel de control:
- Resumen: consulta un panel de control con un resumen de las métricas de tu agente, como la latencia, el número de solicitudes y la tasa de errores.
- Modelos: consulta un panel de métricas del modelo de tu agente, como el número de llamadas al modelo, la tasa de errores del modelo y el uso de tokens del modelo.
- Herramientas: consulta un panel de métricas de las herramientas de tu agente, como el número de llamadas a herramientas, la tasa de errores de las herramientas y la latencia de las herramientas.
- Uso: consulta un panel de control con métricas sobre el uso de tu agente, como el uso de tokens por entrada y salida, la asignación de CPU de los contenedores y la asignación de memoria de los contenedores.
- Registros: consulta los registros de tu agente si has habilitado Cloud Logging para tu agente.

Panel de control de Vertex AI Agent Engine

Eliminar un agente implementado

Elimina un agente desplegado del tiempo de ejecución gestionado de Vertex AI Agent Engine.

Consola

En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

Ir a Agent Engine
En el agente que hayas especificado, haz clic en el menú Más acciones ().
Haz clic en Eliminar.
Haz clic en Eliminar agente.

SDK de Vertex AI para Python

Si ya tienes una instancia del agente implementado (como remote_agent), puedes ejecutar el siguiente comando:

remote_agent.delete(
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

También puedes llamar a agent_engines.delete() para eliminar el agente implementado correspondiente a RESOURCE_NAME de la siguiente manera:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.delete(
    name=RESOURCE_NAME,
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

REST

Llama al método reasoningEngines.delete.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

PROJECT_ID: tu ID de proyecto de GCP
LOCATION: una región admitida
RESOURCE_ID: el ID de recurso del agente implementado

Método HTTP y URL:

DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Para enviar tu solicitud, despliega una de estas opciones:

curl (Linux, macOS o Cloud Shell)

Ejecuta el comando siguiente:

curl -X DELETE \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell (Windows)

Ejecuta el comando siguiente:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method DELETE `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Gestionar agentes implementados Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Mostrar agentes implementados

Consola

SDK de Vertex AI para Python

REST

curl (Linux, macOS o Cloud Shell)

PowerShell (Windows)

Obtener un agente desplegado

Consola

SDK de Vertex AI para Python

REST

curl (Linux, macOS o Cloud Shell)

PowerShell (Windows)

Actualizar un agente implementado

Consola

SDK de Vertex AI para Python

REST

curl (Linux, macOS o Cloud Shell)

PowerShell (Windows)

Configurar la telemetría del agente desplegado

Ver las métricas de un agente implementado

Eliminar un agente implementado

Consola

SDK de Vertex AI para Python

REST

curl (Linux, macOS o Cloud Shell)

PowerShell (Windows)

Siguientes pasos

Gestionar agentes implementados