Descripción general de Vertex AI Agent Engine

Vertex AI Agent Engine, que forma parte de la plataforma de Vertex AI, es un conjunto de servicios que permite a los desarrolladores implementar, administrar y escalar agentes de IA en producción. Agent Engine administra la infraestructura para escalar agentes en producción, de modo que puedas enfocarte en crear aplicaciones. Vertex AI Agent Engine ofrece los siguientes servicios que puedes usar de forma individual o combinada:

  • Tiempo de ejecución:

    • Implementa y escala agentes con un entorno de ejecución administrado y capacidades de administración de extremo a extremo.
    • Personaliza la imagen del contenedor del agente con secuencias de comandos de instalación en tiempo de compilación para las dependencias del sistema.
    • Usa funciones de seguridad, como el cumplimiento de VPC-SC y la configuración de la autenticación y la IAM.
    • Accede a modelos y herramientas, como las llamadas a funciones.
    • Implementa agentes creados con diferentes frameworks de Python y el protocolo abierto Agent2Agent.
  • Calidad y evaluación (versión preliminar): Evalúa la calidad del agente con el servicio de evaluación de IA generativa integrado y optimiza los agentes con ejecuciones de entrenamiento de modelos de Gemini.

  • Almacén de ejemplos (versión preliminar): Almacena y recupera dinámicamente ejemplos de pocos disparos para mejorar el rendimiento del agente.

  • Sesiones (versión preliminar): Las sesiones de Agent Engine te permiten almacenar interacciones individuales entre usuarios y agentes, lo que proporciona fuentes definitivas para el contexto de la conversación.

  • Memory Bank (versión preliminar): Memory Bank de Agent Engine te permite almacenar y recuperar información de las sesiones para personalizar las interacciones del agente.

  • Ejecución de código (versión preliminar): La Ejecución de código de Agent Engine permite que tu agente ejecute código en un entorno de zona de pruebas seguro, aislado y administrado.

  • Observabilidad: Comprende el comportamiento de los agentes con Google Cloud Trace (compatible con OpenTelemetry), Cloud Monitoring y Cloud Logging.

  • Administración: Vertex AI Agent Engine admite varias funciones para ayudarte a administrar agentes en producción y satisfacer tus necesidades empresariales y de seguridad:

    • Detecta amenazas con Security Command Center: Agent Engine Threat Detection (versión preliminar) es un servicio integrado de Security Command Center que te ayuda a detectar e investigar posibles ataques a los agentes implementados en el entorno de ejecución de Agent Engine de Vertex AI.

    • Identidad del agente (vista previa): Usa la identidad del agente de Identity Access Management (IAM) para proporcionar funciones de seguridad y administración de acceso cuando uses agentes en el entorno de ejecución de Vertex AI Agent Engine.

Descripción general conceptual de Vertex AI Agent Engine

Vertex AI Agent Engine es parte de Vertex AI Agent Builder, un conjunto de funciones para descubrir, crear y, luego, implementar agentes de IA.

Crea e implementa en Vertex AI Agent Engine

Nota: Para una experiencia de desarrollo y de implementación basada en IDE optimizada con Vertex AI Agent Engine, considera el agent-starter-pack. Proporciona plantillas listas para usar, una IU integrada para la experimentación y simplifica la implementación, las operaciones, la evaluación, la personalización y la observabilidad.

El flujo de trabajo para compilar un agente en Agent Engine de Vertex AI es el siguiente:

Pasos Descripción
1. Configura el entorno Configura tu proyecto de Google e instala la versión más reciente del SDK de Vertex AI para Python.
2. Desarrolla un agente Desarrollar un agente que se pueda implementar en Vertex AI Agent Engine
3. Implementa el agente Implementa el agente en el entorno de ejecución administrado de Vertex AI Agent Engine.
4. Cómo usar el agente Envía una solicitud a la API para consultar el agente.
5. Administra el agente implementado Administra y borra los agentes que implementaste en Vertex AI Agent Engine.

Los pasos se ilustran en el siguiente diagrama:

Crea e implementa un agente 

Frameworks compatibles

En la siguiente tabla, se describe el nivel de compatibilidad que ofrece Vertex AI Agent Engine para varios frameworks de agentes:

Nivel de asistencia Frameworks de agentes
Plantilla personalizada: Puedes adaptar una plantilla personalizada para admitir la implementación en Vertex AI Agent Engine desde tu framework. CrewAI, marcos personalizados
Integración del SDK de Vertex AI: Vertex AI Agent Engine proporciona plantillas administradas por framework en el SDK y la documentación de Vertex AI. AG2, LlamaIndex
Integración completa: Las funciones se integran para funcionar en todo el framework, Vertex AI Agent Engine y el ecosistema Google Cloud más amplio. Agent Development Kit (ADK), LangChain, LangGraph

Implementa en producción con el paquete inicial de agentes

El paquete de inicio de agentes es una colección de plantillas de agentes de IA generativa listas para producción creadas para Vertex AI Agent Engine. El paquete de inicio de agente proporciona lo siguiente:

  • Plantillas de agentes prediseñadas: ReAct, RAG, multiagente y otras plantillas
  • Zona de pruebas interactiva: Prueba tu agente e interactúa con él.
  • Infraestructura automatizada: Usa Terraform para optimizar la administración de recursos.
  • Canalizaciones de CI/CD: Flujos de trabajo de implementación automatizados que aprovechan Cloud Build
  • Observabilidad: Compatibilidad integrada con Cloud Trace y Cloud Logging.

Para comenzar, consulta la Guía de inicio rápido.

Casos de uso

Para obtener información sobre Vertex AI Agent Engine con ejemplos de extremo a extremo, consulta los siguientes recursos:

Caso de uso Descripción Vínculos
Compila agentes conectándote a APIs públicas Convierte entre monedas.

Crea una función que se conecte a una app de cambio de moneda, lo que permite que el modelo proporcione respuestas precisas a consultas como "¿Cuál es el tipo de cambio de euros a dólares hoy?".
Notebook del SDK de Vertex AI para Python: Introducción a la compilación y la implementación de un agente con Vertex AI Agent Engine
Diseña un proyecto de huerto solar.

Identifica ubicaciones potenciales, busca oficinas y proveedores gubernamentales relevantes, y revisa imágenes satelitales y el potencial solar de regiones y edificios para encontrar la ubicación óptima para instalar tus paneles solares.
Notebook de SDK de Vertex AI para Python - Compila e implementa un agente de la API de Google Maps con Vertex AI Agent Engine
Crea agentes conectándote a bases de datos Integración con AlloyDB y Cloud SQL para PostgreSQL Entrada de blog: Anunciamos LangChain en Vertex AI Agent Builder para AlloyDB y Cloud SQL para PostgreSQL

Notebook del SDK de Vertex AI para Python: Implementa una aplicación de RAG con Cloud SQL para PostgreSQL en Vertex AI Agent Engine

Notebook del SDK de Vertex AI para Python: Implementa una aplicación de RAG con AlloyDB para PostgreSQL en Vertex AI Agent Engine
Crea agentes con herramientas que acceden a los datos de tu base de datos. Notebook del SDK de Vertex AI para Python - Implementa un agente con Vertex AI Agent Engine y MCP Toolbox for Databases
Consulta y comprende los almacenes de datos estructurados con lenguaje natural. Notebook del SDK de Vertex AI para Python - Compila un agente de búsqueda conversacional con Vertex AI Agent Engine y RAG en Vertex AI Search
Consulta y comprende bases de datos de grafos con lenguaje natural Entrada de blog - GenAI GraphRAG y agentes de IA que usan Vertex AI Agent Engine con LangChain y Neo4j
Consulta y comprende almacenes de vectores con lenguaje natural Entrada de blog: Simplifica la API de RAG de IA generativa con MongoDB Atlas y Vertex AI Agent Engine
Crea agentes con el Kit de desarrollo de agentes Crear e implementar agentes con el Kit de desarrollo de agentes Kit de desarrollo de agentes: Implementa en Vertex AI Agent Engine
Convertir entre monedas con el modo Express

Crea una función que se conecte a una app de cambio de moneda, lo que permite que el modelo proporcione respuestas precisas a consultas como "¿Cuál es el tipo de cambio de euros a dólares hoy?", y, luego, impleméntala en Agent Engine sin facturación con el modo Exprés de Vertex AI.
Notebook del SDK de Vertex AI para Python: Implementa en Vertex AI Agent Engine en el modo Vertex AI Express.
Administra el contexto con las sesiones y Memory Bank de Vertex AI Agent Engine en el modo express de Vertex AI sin facturación. Kit de desarrollo de agentes: Sesiones de Vertex AI Agent Engine y banco de memoria en el modo exprés de Vertex AI.
Compila agentes con frameworks de OSS Compila e implementa agentes con el framework de código abierto OneTwo. Entrada de blog - OneTwo y Vertex AI Agent Engine: explora el desarrollo avanzado de agentes de IA en Google Cloud
Compila e implementa agentes con el framework de código abierto LangGraph. Notebook del SDK de Vertex AI para Python: Compila e implementa una aplicación de LangGraph con Vertex AI Agent Engine
Depuración y optimización de agentes Compila y realiza seguimientos de agentes mediante OpenTelemetry y Cloud Trace. Cuaderno de notas del SDK de Vertex AI para Python - Agentes de depuración y optimización: Una guía de seguimiento en Vertex AI Agent Engine
Crea sistemas multiagente con el protocolo A2A (versión preliminar) Crea agentes interoperables que se comuniquen y colaboren con otros agentes, independientemente de su framework. Para obtener más información, consulta la documentación del protocolo A2A.

Seguridad empresarial

Vertex AI Agent Engine admite varias funciones para ayudarte a cumplir con los requisitos de seguridad de la empresa, respetar las políticas de seguridad de tu organización y seguir las prácticas recomendadas de seguridad. Se admiten las siguientes funciones:

  • Controles del servicio de VPC: Vertex AI Agent Engine admite los Controles del servicio de VPC para fortalecer la seguridad de los datos y mitigar los riesgos de robo de datos. Cuando se configuran los Controles del servicio de VPC, el agente implementado conserva el acceso seguro a las APIs y los servicios de Google, como la API de BigQuery, la API de Cloud SQL Admin y la API de Vertex AI, lo que verifica el funcionamiento sin problemas dentro del perímetro definido. Fundamentalmente, los Controles del servicio de VPC bloquean de manera eficaz todo el acceso público a Internet, lo que limita el movimiento de datos a los límites de tu red autorizada y mejora significativamente tu nivel de seguridad empresarial.

  • Interfaz de Private Service Connect: Para el entorno de ejecución de Vertex AI Agent Engine, PSC-I permite que tus agentes interactúen con servicios alojados de forma privada en la VPC de un usuario. Para obtener más información, consulta Usa la interfaz de Private Service Connect con Vertex AI Agent Engine.

  • Claves de encriptación administradas por el cliente (CMEK): Vertex AI Agent Engine admite CMEK para proteger tus datos con tus propias claves de encriptación, lo que te otorga la propiedad y el control total de las claves que protegen tus datos en reposo en Google Cloud. Para obtener más información, consulta CMEK de Agent Engine.

  • Residencia de datos (DRZ): Vertex AI Agent Engine admite la residencia de datos (DRZ) para garantizar que todos los datos en reposo y en uso se almacenen dentro de la región especificada.

  • HIPAA: Como parte de Vertex AI Platform, Vertex AI Agent Engine admite cargas de trabajo de la HIPAA.

  • Transparencia de acceso: La Transparencia de acceso te proporciona registros que captan las acciones que realizan los empleados de Google cuando acceden a tu contenido. Para obtener más información sobre cómo habilitar la Transparencia de acceso para Vertex AI Agent Engine, consulta Transparencia de acceso en Vertex AI.

En la siguiente tabla, se muestran las funciones de seguridad empresarial compatibles con cada servicio de Agent Engine:

Función de seguridad Entorno de ejecución Sesiones Banco de memoria Almacén de ejemplos Ejecución de código
Controles del servicio de VPC No No
Claves de encriptación administradas por el cliente No No
Residencia de datos (DRZ) en reposo No No
Residencia de datos (DRZ) en uso No * No
HIPAA No
Transparencia de acceso No No

* Solo cuando se usa un extremo regional de Gemini.

Compatibilidad con el modo Exprés

Vertex AI Agent Engine admite Vertex AI en modo Express. Esto te permite usar Vertex AI Agent Engine sin crear un Google Cloud proyecto.

En el modo Exprés, Vertex AI Agent Engine admite lo siguiente:

  • (Nivel gratuito o pagado) Durante el desarrollo del agente del cliente, el modo Exprés de Vertex AI te permite acceder a los modelos de Vertex AI Studio con una clave de API.

  • (Nivel gratuito o pagado) En el modo exprés, puedes crear una instancia de ReasoningEngine, que te permite usar los servicios de Session y Memory Bank.

  • Puedes implementar un agente en Vertex AI Agent Engine con los siguientes métodos:

    • (Nivel gratuito o pagado) Desde archivos fuente: Implementa tu agente directamente desde el código fuente local sin usar un bucket de Cloud Storage.

    • (Solo para el nivel pagado) Desde un objeto de agente: Debes habilitar la facturación en tu cuenta de modo exprés. Esto se debe a que la implementación desde un objeto de agente requiere un bucket de Cloud Storage para almacenar el código y los artefactos del agente, y Cloud Storage requiere el modo Express con facturación.

Regiones admitidas

Consulta Ubicaciones para obtener una lista de las regiones admitidas para Vertex AI Agent Engine.

Cuota

Consulta Cuotas y límites del sistema para obtener información sobre las cuotas de Vertex AI Agent Engine.

Precios

Hay un nivel gratuito disponible para el entorno de ejecución de Vertex AI Agent Engine.

Para obtener información sobre los precios de Agent Engine Runtime, consulta los precios de Vertex AI.

Migración al SDK basado en el cliente

El módulo agent_engines del SDK de Vertex AI para Python se está refactorizando a un diseño basado en el cliente por los siguientes motivos principales:

  • Para alinearse con el ADK de Google y el SDK de IA generativa de Google en representaciones de tipos canónicos Esto garantiza una forma coherente y estandarizada de representar los tipos de datos en los diferentes SDKs, lo que simplifica la interoperabilidad y reduce la sobrecarga de conversión.
  • Permite definir el alcance de los parámetros Google Cloud a nivel del cliente en aplicaciones de varios proyectos y varias ubicaciones. Esto permite que una aplicación administre las interacciones con los recursos en diferentes Google Cloud proyectos y ubicaciones geográficas configurando cada instancia del cliente con su proyecto específico y su configuración de ubicación.
  • Mejorar la visibilidad y la cohesión de los servicios de Vertex AI Agent Engine

¿Qué sigue?