En esta página se describe cómo gestionar los agentes que se han desplegado en el tiempo de ejecución gestionado de Vertex AI Agent Engine. Los agentes desplegados son recursos de tipo reasoningEngine en Vertex AI.
Mostrar agentes implementados
Para ver todos los agentes implementados de un proyecto y una ubicación determinados, haz lo siguiente:
Consola
- En la Google Cloud consola, ve a la página Vertex AI Agent Engine.
En la lista se muestran los agentes implementados que forman parte del proyecto seleccionado. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.
SDK de Vertex AI para Python
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
for agent in client.agent_engines.list():
print(agent)
Para filtrar la lista por display_name, sigue estos pasos:
for agent in client.agent_engines.list(
config={
"filter": 'display_name="DISPLAY_NAME"',
},
):
print(agent)
REST
Llama al método reasoningEngines.list.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
PROJECT_ID: tu ID de proyecto de GCPLOCATION: una región admitida
Método HTTP y URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.
Modo exprés de Vertex AI
Puedes usar el SDK de Vertex AI para Python o REST con el modo exprés de Vertex AI. Para obtener más información sobre el modo exprés de Vertex AI e instrucciones sobre cómo registrarte, consulta la descripción general del modo exprés de Vertex AI.
SDK de Vertex AI
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
for agent in client.agent_engines.list():
print(agent)
Sustituye API_KEY por tu clave de API del modo Exprés
Para filtrar la lista por display_name, sigue estos pasos:
for agent in client.agent_engines.list(
config={
"filter": 'display_name="DISPLAY_NAME"',
},
):
print(agent)
API REST
El siguiente comando REST llama al método reasoningEngines.list:
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
API_KEY: tu clave de API del modo exprés
Método HTTP y URL:
GET https://aiplatform.googleapis.com/v1/projects/reasoningEngines?key=API_KEY
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.
Obtener un agente desplegado
Cada agente implementado tiene un identificador RESOURCE_ID único.
Para obtener más información, consulta Implementar un agente.
Consola
- En la Google Cloud consola, ve a la página Vertex AI Agent Engine.
En la lista se muestran los agentes implementados que forman parte del proyecto seleccionado. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.
Haz clic en el nombre del agente especificado. Se abrirá la página Métricas del agente.
(Opcional) Para ver los detalles de la implementación del agente, haz clic en Detalles de la implementación. Se abrirá el panel Detalles de la implementación. Para cerrar el panel, haz clic en Hecho.
(Opcional) Para ver las URLs de
queryystreamQuerydel agente, haga clic en URLs de la API. Se abrirá el panel URLs de la API. Para cerrar el panel, haz clic en Hecho.
SDK de Vertex AI para Python
El siguiente código te permite obtener un agente implementado específico:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
remote_agent = client.agent_engines.get(
name="projects/PROJECT_ID_OR_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)
REST
Llama al método reasoningEngines.get.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
PROJECT_ID: tu ID de proyecto de GCPLOCATION: una región admitidaRESOURCE_ID: el ID de recurso del agente implementado
Método HTTP y URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.
Modo exprés de Vertex AI
Puedes usar el SDK de Vertex AI para Python o REST con el modo exprés de Vertex AI. Para obtener más información sobre el modo exprés de Vertex AI e instrucciones sobre cómo registrarse, consulta la descripción general del modo exprés de Vertex AI.
SDK de Vertex AI
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
remote_agent = client.agent_engines.get(
name="RESOURCE_NAME"
)
# Resource Name: "projects/{PROJECT_NUMBER}/locations/{LOCATION}/reasoningEngines/{RESOURCE_ID}"
# RESOURCE_ID can be used for the REST commands
Sustituye API_KEY por tu clave de API del modo Exprés
API REST
El siguiente comando REST llama al método reasoningEngines.get:
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
RESOURCE_ID: el ID de recurso del agente implementadoAPI_KEY: tu clave de API del modo exprés
Método HTTP y URL:
GET https://aiplatform.googleapis.com/v1/reasoningEngines/RESOURCE_ID?key=API_KEY
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.
Actualizar un agente implementado
Puede actualizar uno o varios campos del agente implementado al mismo tiempo, pero debe especificar al menos uno de los campos que se van a actualizar. El tiempo que se tarda en actualizar el agente implementado depende de la actualización que se esté realizando, pero suele ser de unos segundos a unos minutos.
Consola
- En la Google Cloud consola, ve a la página Vertex AI Agent Engine.
En el agente que hayas especificado, haz clic en el menú más acciones ().
Haz clic en Editar. Se abrirá el panel Editar del agente.
Edita el Nombre visible o la Descripción del agente.
Haz clic en Guardar.
SDK de Vertex AI para Python
Para actualizar un agente implementado (correspondiente a RESOURCE_NAME) a un agente actualizado (correspondiente a UPDATED_AGENT), sigue estos pasos:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
client.agent_engines.update(
name=RESOURCE_NAME, # Required.
agent=UPDATED_AGENT, # Optional.
config={ # Optional.
"requirements": REQUIREMENTS, # Optional.
"display_name": "DISPLAY_NAME", # Optional.
"description": "DESCRIPTION", # Optional.
"extra_packages": EXTRA_PACKAGES, # Optional.
},
)
Los argumentos son los mismos que cuando despliegas un agente.
REST
Llama al método reasoningEngines.patch y proporciona un update_mask para especificar qué campos se van a actualizar.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
PROJECT_ID: tu ID de proyecto de GCPLOCATION: una región admitidaRESOURCE_ID: el ID de recurso del agente implementadoupdate_mask: una lista de campos separados por comas que se van a actualizar.
Método HTTP y URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"
Cuerpo JSON de la solicitud:
{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.
Modo exprés de Vertex AI
Puedes usar el SDK de Vertex AI para Python o REST con el modo exprés de Vertex AI. Para obtener más información sobre el modo exprés de Vertex AI e instrucciones sobre cómo registrarte, consulta la descripción general del modo exprés de Vertex AI.
SDK de Vertex AI
El siguiente código usa el SDK de Vertex AI para Python para actualizar un agente desplegado (correspondiente a RESOURCE_NAME) a un agente actualizado (correspondiente a UPDATED_AGENT):
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
client.agent_engines.update(
name=RESOURCE_NAME, # Required.
agent=UPDATED_AGENT, # Optional.
config={ # Optional.
"requirements": REQUIREMENTS, # Optional.
"display_name": "DISPLAY_NAME", # Optional.
"description": "DESCRIPTION", # Optional.
"extra_packages": EXTRA_PACKAGES, # Optional.
},
)
Sustituye API_KEY por tu clave de API del modo Exprés
API REST
El siguiente comando REST llama al método reasoningEngines.patch y proporciona un update_mask para especificar qué campos se deben actualizar:
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
RESOURCE_ID: el ID de recurso del agente implementadoAPI_KEY: tu clave de API del modo exprésupdate_mask: una lista de campos separados por comas que se van a actualizar.
Método HTTP y URL:
PATCH https://aiplatform.googleapis.com/v1/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"&key=API_KEY
Cuerpo JSON de la solicitud:
{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.
Configurar la telemetría del agente desplegado
Si habilitaste los rastreos durante el desarrollo del agente, puedes usar la consola Google Cloud para configurar la telemetría de tu agente implementado.
Configura la telemetría de los agentes implementados con la telemetría habilitada:
- En la Google Cloud consola, ve a la página Vertex AI Agent Engine.
Las instancias de Agent Engine que forman parte del proyecto seleccionado aparecen en la lista. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.
Busca la fila de tu instancia de Agent Engine. En la columna Configuración de telemetría, haz clic en Configurar. Se abrirá el panel Configuración del servicio.
Puedes hacer las siguientes configuraciones:
Observabilidad: puedes configurar lo siguiente:
Habilita la instrumentación de trazas y registros de OpenTelemetry: para rellenar el panel de observabilidad del agente y las páginas de trazas, haz clic en el interruptor para activarlo.
Habilitar el registro de las entradas de las peticiones y las salidas de las respuestas: para recoger y almacenar el contenido completo de las peticiones y las respuestas de los usuarios, haz clic en el interruptor para activarlo.
Si la recogida de telemetría está inhabilitada en tu agente, debes volver a implementar el agente y actualizar la versión del SDK de Vertex AI a
>= 1.126.1para ver las opciones de configuración de Observabilidad.Contenedores: configure los ajustes de los contenedores de su agente implementado:
Escalado: introduce un Número mínimo de instancias y un Número máximo de instancias.
Recursos: selecciona los límites de Memoria y CPU de cada contenedor.
Concurrencia de contenedor: introduce un Número mínimo de instancias para definir la concurrencia de cada contenedor y servidor de agente. El valor recomendado es (2 * CPU + 1) y el valor predeterminado es 9.
Acceso y permisos: haz clic en Gestionar permisos en IAM para gestionar los permisos del agente en la cuenta de servicio asociada.
Detalles del despliegue: consulta los detalles del despliegue del agente, como el nombre del recurso y el nombre visible.
Banco de memoria: consulta los detalles del banco de memoria del agente, como la generación de memoria y la búsqueda en la memoria.
Haz clic en Actualizar o en Cerrar.
Ver las métricas de un agente implementado
En el caso de los agentes implementados, puedes usar la consola para ver las métricas de tu agente:
- En la Google Cloud consola, ve a la página Vertex AI Agent Engine.
En la lista se muestran los agentes implementados que forman parte del proyecto seleccionado. Puede usar el campo Filtrar para filtrar la lista por la columna que haya especificado.
Haz clic en el nombre de tu agente. Se muestra el panel de control del agente seleccionado.
Seleccione una de las siguientes pestañas Panel de control:
Resumen: consulta un panel de control con un resumen de las métricas de tu agente, como la latencia, el número de solicitudes y la tasa de errores.
Modelos: consulta un panel de métricas del modelo de tu agente, como el número de llamadas al modelo, la tasa de errores del modelo y el uso de tokens del modelo.
Herramientas: consulta un panel de métricas de las herramientas de tu agente, como el número de llamadas a herramientas, la tasa de errores de las herramientas y la latencia de las herramientas.
Uso: consulta un panel de control con métricas sobre el uso de tu agente, como el uso de tokens por entrada y salida, la asignación de CPU de los contenedores y la asignación de memoria de los contenedores.
Registros: consulta los registros de tu agente si has habilitado Cloud Logging para tu agente.

Eliminar un agente implementado
Elimina un agente desplegado del tiempo de ejecución gestionado de Vertex AI Agent Engine.
Consola
- En la Google Cloud consola, ve a la página Vertex AI Agent Engine.
En el agente que hayas especificado, haz clic en el menú Más acciones ().
Haz clic en Eliminar.
Haz clic en Eliminar agente.
SDK de Vertex AI para Python
Si ya tienes una instancia del agente implementado
(como remote_agent), puedes ejecutar el siguiente comando:
remote_agent.delete(
force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)
También puedes llamar a agent_engines.delete() para eliminar el agente implementado correspondiente a RESOURCE_NAME de la siguiente manera:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
project="PROJECT_ID",
location="LOCATION",
)
client.agent_engines.delete(
name=RESOURCE_NAME,
force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)
REST
Llama al método reasoningEngines.delete.
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
PROJECT_ID: tu ID de proyecto de GCPLOCATION: una región admitidaRESOURCE_ID: el ID de recurso del agente implementado
Método HTTP y URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.
Modo exprés de Vertex AI
Puedes usar el SDK de Vertex AI para Python o REST con el modo exprés de Vertex AI.
SDK de Vertex AI
El siguiente código usa el SDK de Vertex AI para Python para eliminar el agente desplegado correspondiente a RESOURCE_NAME de la siguiente manera:
import vertexai
client = vertexai.Client( # For service interactions via client.agent_engines
api_key="API_KEY",
)
client.agent_engines.delete(
name=RESOURCE_NAME,
force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)
Sustituye API_KEY por tu clave de API del modo Exprés
API REST
El siguiente comando REST llama al método reasoningEngines.delete:
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
RESOURCE_ID: el ID de recurso del agente implementadoAPI_KEY: tu clave de API del modo exprés
Método HTTP y URL:
DELETE https://aiplatform.googleapis.com/v1/projects/reasoningEngines/RESOURCE_ID?key=API_KEY
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir un código de estado que indique que la operación se ha realizado correctamente (2xx) y una respuesta vacía.