Gestionar agentes implementados

En esta página se describe cómo gestionar los agentes que se han desplegado en el tiempo de ejecución gestionado de Vertex AI Agent Engine. Los agentes desplegados son recursos de tipo reasoningEngine en Vertex AI.

Mostrar agentes implementados

Para ver todos los agentes implementados de un proyecto y una ubicación determinados, haz lo siguiente:

Consola

  1. En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

    Ir a Agent Engine

En la lista se muestran los agentes implementados que forman parte del proyecto seleccionado. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.

SDK de Vertex AI para Python

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

for agent in client.agent_engines.list():
    print(agent)

Para filtrar la lista por display_name, sigue estos pasos:

for agent in client.agent_engines.list(
    config={
        "filter": 'display_name="DISPLAY_NAME"',
    },
):
    print(agent)

REST

Llama al método reasoningEngines.list.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • PROJECT_ID: tu ID de proyecto de GCP
  • LOCATION: una región admitida

Método HTTP y URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

Para enviar tu solicitud, despliega una de estas opciones:

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Modo exprés de Vertex AI

Puedes usar el SDK de Vertex AI para Python o REST con el modo exprés de Vertex AI. Para obtener más información sobre el modo exprés de Vertex AI e instrucciones sobre cómo registrarte, consulta la descripción general del modo exprés de Vertex AI.

SDK de Vertex AI

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    api_key="API_KEY",
)

for agent in client.agent_engines.list():
    print(agent)

Sustituye API_KEY por tu clave de API del modo Exprés

Para filtrar la lista por display_name, sigue estos pasos:

for agent in client.agent_engines.list(
    config={
        "filter": 'display_name="DISPLAY_NAME"',
    },
):
    print(agent)

API REST

El siguiente comando REST llama al método reasoningEngines.list:

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • API_KEY: tu clave de API del modo exprés

Método HTTP y URL:

GET https://aiplatform.googleapis.com/v1/projects/reasoningEngines?key=API_KEY

Para enviar tu solicitud, despliega una de estas opciones:

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Obtener un agente desplegado

Cada agente implementado tiene un identificador RESOURCE_ID único. Para obtener más información, consulta Implementar un agente.

Consola

  1. En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

    Ir a Agent Engine

    En la lista se muestran los agentes implementados que forman parte del proyecto seleccionado. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.

  2. Haz clic en el nombre del agente especificado. Se abrirá la página Métricas del agente.

  3. (Opcional) Para ver los detalles de la implementación del agente, haz clic en Detalles de la implementación. Se abrirá el panel Detalles de la implementación. Para cerrar el panel, haz clic en Hecho.

  4. (Opcional) Para ver las URLs de query y streamQuery del agente, haga clic en URLs de la API. Se abrirá el panel URLs de la API. Para cerrar el panel, haz clic en Hecho.

SDK de Vertex AI para Python

El siguiente código te permite obtener un agente implementado específico:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

remote_agent = client.agent_engines.get(
    name="projects/PROJECT_ID_OR_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

Llama al método reasoningEngines.get.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • PROJECT_ID: tu ID de proyecto de GCP
  • LOCATION: una región admitida
  • RESOURCE_ID: el ID de recurso del agente implementado

Método HTTP y URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Para enviar tu solicitud, despliega una de estas opciones:

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Modo exprés de Vertex AI

Puedes usar el SDK de Vertex AI para Python o REST con el modo exprés de Vertex AI. Para obtener más información sobre el modo exprés de Vertex AI e instrucciones sobre cómo registrarse, consulta la descripción general del modo exprés de Vertex AI.

SDK de Vertex AI

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    api_key="API_KEY",
)

remote_agent = client.agent_engines.get(
    name="RESOURCE_NAME"
)
# Resource Name: "projects/{PROJECT_NUMBER}/locations/{LOCATION}/reasoningEngines/{RESOURCE_ID}"
# RESOURCE_ID can be used for the REST commands

Sustituye API_KEY por tu clave de API del modo Exprés

API REST

El siguiente comando REST llama al método reasoningEngines.get:

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • RESOURCE_ID: el ID de recurso del agente implementado
  • API_KEY: tu clave de API del modo exprés

Método HTTP y URL:

GET https://aiplatform.googleapis.com/v1/reasoningEngines/RESOURCE_ID?key=API_KEY

Para enviar tu solicitud, despliega una de estas opciones:

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Actualizar un agente implementado

Puede actualizar uno o varios campos del agente implementado al mismo tiempo, pero debe especificar al menos uno de los campos que se van a actualizar. El tiempo que se tarda en actualizar el agente implementado depende de la actualización que se esté realizando, pero suele ser de unos segundos a unos minutos.

Consola

  1. En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

    Ir a Agent Engine

  2. En el agente que hayas especificado, haz clic en el menú más acciones ().

  3. Haz clic en Editar. Se abrirá el panel Editar del agente.

  4. Edita el Nombre visible o la Descripción del agente.

  5. Haz clic en Guardar.

SDK de Vertex AI para Python

Para actualizar un agente implementado (correspondiente a RESOURCE_NAME) a un agente actualizado (correspondiente a UPDATED_AGENT), sigue estos pasos:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.update(
    name=RESOURCE_NAME,                    # Required.
    agent=UPDATED_AGENT,                   # Optional.
    config={                                                # Optional.
        "requirements": REQUIREMENTS,      # Optional.
        "display_name": "DISPLAY_NAME",    # Optional.
        "description": "DESCRIPTION",      # Optional.
        "extra_packages": EXTRA_PACKAGES,  # Optional.
    },
)

Los argumentos son los mismos que cuando despliegas un agente.

REST

Llama al método reasoningEngines.patch y proporciona un update_mask para especificar qué campos se van a actualizar.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • PROJECT_ID: tu ID de proyecto de GCP
  • LOCATION: una región admitida
  • RESOURCE_ID: el ID de recurso del agente implementado
  • update_mask: una lista de campos separados por comas que se van a actualizar.

Método HTTP y URL:

PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"

Cuerpo JSON de la solicitud:

{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}

Para enviar tu solicitud, despliega una de estas opciones:

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Modo exprés de Vertex AI

Puedes usar el SDK de Vertex AI para Python o REST con el modo exprés de Vertex AI. Para obtener más información sobre el modo exprés de Vertex AI e instrucciones sobre cómo registrarte, consulta la descripción general del modo exprés de Vertex AI.

SDK de Vertex AI

El siguiente código usa el SDK de Vertex AI para Python para actualizar un agente desplegado (correspondiente a RESOURCE_NAME) a un agente actualizado (correspondiente a UPDATED_AGENT):

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    api_key="API_KEY",
)

client.agent_engines.update(
    name=RESOURCE_NAME,                    # Required.
    agent=UPDATED_AGENT,                   # Optional.
    config={                                                # Optional.
        "requirements": REQUIREMENTS,      # Optional.
        "display_name": "DISPLAY_NAME",    # Optional.
        "description": "DESCRIPTION",      # Optional.
        "extra_packages": EXTRA_PACKAGES,  # Optional.
    },
)

Sustituye API_KEY por tu clave de API del modo Exprés

API REST

El siguiente comando REST llama al método reasoningEngines.patch y proporciona un update_mask para especificar qué campos se deben actualizar:

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • RESOURCE_ID: el ID de recurso del agente implementado
  • API_KEY: tu clave de API del modo exprés
  • update_mask: una lista de campos separados por comas que se van a actualizar.

Método HTTP y URL:

PATCH https://aiplatform.googleapis.com/v1/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"&key=API_KEY

Cuerpo JSON de la solicitud:

{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}

Para enviar tu solicitud, despliega una de estas opciones:

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Configurar la telemetría del agente desplegado

Si habilitaste los rastreos durante el desarrollo del agente, puedes usar la consola Google Cloud para configurar la telemetría de tu agente implementado.

Configura la telemetría de los agentes implementados con la telemetría habilitada:

  1. En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

    Ir a Agent Engine

    Las instancias de Agent Engine que forman parte del proyecto seleccionado aparecen en la lista. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.

  2. Busca la fila de tu instancia de Agent Engine. En la columna Configuración de telemetría, haz clic en Configurar. Se abrirá el panel Configuración del servicio.

  3. Puedes hacer las siguientes configuraciones:

    • Observabilidad: puedes configurar lo siguiente:

      • Habilita la instrumentación de trazas y registros de OpenTelemetry: para rellenar el panel de observabilidad del agente y las páginas de trazas, haz clic en el interruptor para activarlo.

      • Habilitar el registro de las entradas de las peticiones y las salidas de las respuestas: para recoger y almacenar el contenido completo de las peticiones y las respuestas de los usuarios, haz clic en el interruptor para activarlo.

      Si la recogida de telemetría está inhabilitada en tu agente, debes volver a implementar el agente y actualizar la versión del SDK de Vertex AI a >= 1.126.1 para ver las opciones de configuración de Observabilidad.

    • Contenedores: configure los ajustes de los contenedores de su agente implementado:

      • Escalado: introduce un Número mínimo de instancias y un Número máximo de instancias.

      • Recursos: selecciona los límites de Memoria y CPU de cada contenedor.

      • Concurrencia de contenedor: introduce un Número mínimo de instancias para definir la concurrencia de cada contenedor y servidor de agente. El valor recomendado es (2 * CPU + 1) y el valor predeterminado es 9.

    • Acceso y permisos: haz clic en Gestionar permisos en IAM para gestionar los permisos del agente en la cuenta de servicio asociada.

    • Detalles del despliegue: consulta los detalles del despliegue del agente, como el nombre del recurso y el nombre visible.

    • Banco de memoria: consulta los detalles del banco de memoria del agente, como la generación de memoria y la búsqueda en la memoria.

  4. Haz clic en Actualizar o en Cerrar.

Ver las métricas de un agente implementado

En el caso de los agentes implementados, puedes usar la consola para ver las métricas de tu agente:

  1. En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

    Ir a Agent Engine

    En la lista se muestran los agentes implementados que forman parte del proyecto seleccionado. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.

  2. Haz clic en el nombre de tu agente. Se muestra el panel de control del agente seleccionado.

  3. Seleccione una de las siguientes pestañas Panel de control:

    • Resumen: consulta un panel de control con un resumen de las métricas de tu agente, como la latencia, el número de solicitudes y la tasa de errores.

    • Modelos: consulta un panel de métricas del modelo de tu agente, como el número de llamadas al modelo, la tasa de errores del modelo y el uso de tokens del modelo.

    • Herramientas: consulta un panel de métricas de las herramientas de tu agente, como el número de llamadas a herramientas, la tasa de errores de las herramientas y la latencia de las herramientas.

    • Uso: consulta un panel de control con métricas sobre el uso de tu agente, como el uso de tokens por entrada y salida, la asignación de CPU de los contenedores y la asignación de memoria de los contenedores.

    • Registros: consulta los registros de tu agente si has habilitado Cloud Logging para tu agente.

Panel de control de Vertex AI Agent Engine

Eliminar un agente implementado

Elimina un agente desplegado del tiempo de ejecución gestionado de Vertex AI Agent Engine.

Consola

  1. En la Google Cloud consola, ve a la página Vertex AI Agent Engine.

    Ir a Agent Engine

  2. En el agente que hayas especificado, haz clic en el menú Más acciones ().

  3. Haz clic en Eliminar.

  4. Haz clic en Eliminar agente.

SDK de Vertex AI para Python

Si ya tienes una instancia del agente implementado (como remote_agent), puedes ejecutar el siguiente comando:

remote_agent.delete(
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

También puedes llamar a agent_engines.delete() para eliminar el agente implementado correspondiente a RESOURCE_NAME de la siguiente manera:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.delete(
    name=RESOURCE_NAME,
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

REST

Llama al método reasoningEngines.delete.

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • PROJECT_ID: tu ID de proyecto de GCP
  • LOCATION: una región admitida
  • RESOURCE_ID: el ID de recurso del agente implementado

Método HTTP y URL:

DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Para enviar tu solicitud, despliega una de estas opciones:

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Modo exprés de Vertex AI

Puedes usar el SDK de Vertex AI para Python o REST con el modo exprés de Vertex AI.

SDK de Vertex AI

El siguiente código usa el SDK de Vertex AI para Python para eliminar el agente desplegado correspondiente a RESOURCE_NAME de la siguiente manera:

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    api_key="API_KEY",
)

client.agent_engines.delete(
    name=RESOURCE_NAME,
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

Sustituye API_KEY por tu clave de API del modo Exprés

API REST

El siguiente comando REST llama al método reasoningEngines.delete:

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • RESOURCE_ID: el ID de recurso del agente implementado
  • API_KEY: tu clave de API del modo exprés

Método HTTP y URL:

DELETE https://aiplatform.googleapis.com/v1/projects/reasoningEngines/RESOURCE_ID?key=API_KEY

Para enviar tu solicitud, despliega una de estas opciones:

Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.

Siguientes pasos