Agent Runtime

Agent Runtime es un conjunto de servicios que permite a los desarrolladores implementar, administrar y escalar agentes de IA en producción. Agent Runtime administra la infraestructura para escalar agentes en producción, de modo que puedas enfocarte en crear aplicaciones. Agent Runtime ofrece los siguientes servicios que puedes usar de forma individual o combinada:

  • Entorno de ejecución:
    • Implementa y escala agentes con un entorno de ejecución administrado y capacidades de administración de extremo a extremo.
    • Personaliza la imagen de contenedor del agente con secuencias de comandos de instalación en tiempo de compilación para las dependencias del sistema.
    • Usa funciones de seguridad, como el cumplimiento de VPC-SC y la configuración de la autenticación y la IAM.
    • Accede a modelos y herramientas como las llamadas a funciones.
    • Implementa agentes creados con diferentes frameworks de Python y el protocolo abierto Agent2Agent.
  • Calidad y evaluación (vista previa): Evalúa la calidad del agente con el servicio de Gen AI Evaluation Service integrado y optimiza los agentes con ejecuciones de entrenamiento de modelos de Gemini.
  • Sesiones de Agent Platform: Las sesiones de Agent Platform te permiten almacenar interacciones individuales entre usuarios y agentes, lo que proporciona fuentes definitivas para el contexto de la conversación.
  • Memory Bank de Agent Platform: El Memory Bank de Agent Platform de Agent Runtime te permite almacenar y recuperar información de las sesiones para personalizar las interacciones del agente.
  • Ejecución de código: La Ejecución de código de Agent Runtime permite que tu agente ejecute código en un entorno de zona de pruebas seguro, aislado, y administrado.
  • Almacén de ejemplos (vista previa): Almacena y recupera dinámicamente varios ejemplos para mejorar el rendimiento del agente.
  • Observabilidad: Comprende el comportamiento de los agentes con Google Cloud Trace (compatible con OpenTelemetry), Cloud Monitoring y Cloud Logging.
  • Administración: Agent Runtime admite varias funciones para ayudarte a administrar agentes en producción y satisfacer tus necesidades de seguridad y empresariales:
    • Detecta amenazas con Security Command Center: La Detección de amenazas de Agent Runtime (vista previa) es un servicio integrado de Security Command Center que te ayuda a detectar y a investigar posibles ataques a agentes implementados en Agent Runtime.
    • Identidad del agente (vista previa): Usa la identidad del agente de Identity Access Management (IAM) para proporcionar funciones de seguridad y administración de acceso cuando usas agentes en Agent Runtime.
    • Puerta de enlace del agente (vista previa): Usa la Puerta de enlace del agente para definir reglas para las comunicaciones de agentes y aplicar políticas de seguridad y control de acceso en agentes, clientes y herramientas que se conectan a tu proyecto y desde él. Google Cloud

Crea e implementa en Agent Runtime

El flujo de trabajo para compilar un agente en Agent Runtime es el siguiente:

  1. Configura el entorno: Configura tu proyecto de Google e instala la versión más reciente del SDK de Agent Platform para Python.
  2. Desarrolla un agente: Desarrolla un agente que se pueda implementar en Agent Runtime.
  3. Implementa el agente: Implementa el agente en el entorno de ejecución administrado de Agent Runtime.
  4. **Usa el agente**: Envía una solicitud a la API para consultar el agente.
  5. Administra el agente implementado: Administra y borra los agentes que implementaste en Agent Runtime.

Los pasos se ilustran en el siguiente diagrama:

Crea e implementa un agente 

Frameworks compatibles

En la siguiente tabla, se describe el nivel de compatibilidad que Agent Runtime proporciona para varios frameworks de agentes:

Nivel de asistencia Frameworks de agentes
Plantilla personalizada: Puedes adaptar una plantilla personalizada para admitir la implementación en Agent Runtime desde tu framework. CrewAI, frameworks personalizados
Integración del SDK de Agent Platform: Agent Runtime proporciona plantillas administradas por framework en el SDK de Agent Platform y la documentación. AG2, LlamaIndex
Integración completa: Las funciones están integradas para funcionar en el framework, Agent Runtime y el ecosistema más amplio Google Cloud . Kit de desarrollo de agentes (ADK), LangChain, LangGraph

Implementa en producción con la CLI de Agents

La CLI de Agents es la interfaz de línea de comandos y el conjunto de habilidades unificados para Agent Platform de Gemini Enterprise. Proporciona a los agentes de codificación y a los desarrolladores una ruta predecible a través del ciclo de vida de desarrollo de agentes: andamiaje, evaluación, implementación, publicación y observación. La CLI de Agents proporciona lo siguiente:

  • Plantillas de agentes prediseñadas: ReAct, RAG, multiagente y otras plantillas.
  • Zona de pruebas interactiva: Prueba tu agente e interactúa con él.
  • Infraestructura automatizada: Usa Terraform para la administración optimizada de recursos.
  • Canalizaciones de CI/CD: Flujos de trabajo de implementación automatizados que aprovechan Cloud Build.
  • Observabilidad: Compatibilidad integrada con Cloud Trace y Cloud Logging.

Para comenzar, consulta la Guía de inicio rápido.

Casos de uso

Para obtener información sobre Agent Runtime con ejemplos de extremo a extremo, consulta los siguientes recursos:

Haz clic para expandir los casos de uso

Caso de uso Descripción Vínculos
Compila agentes conectándote a APIs públicas Convierte entre monedas.

Crea una función que se conecte a una app de cambio de moneda, lo que permite que el modelo proporcione respuestas precisas a consultas como "¿Cuál es el tipo de cambio de euros a dólares hoy?".
Notebook del SDK de Agent Platform (Python): Introducción a la compilación y la implementación de un agente con Agent Runtime
Diseña un proyecto de huerto solar.

Identifica ubicaciones potenciales busca oficinas y proveedores gubernamentales relevantes, y revisa imágenes satelitales y el potencial solar de regiones y edificios para encontrar la ubicación óptima para instalar tus paneles solares.
Notebook del SDK de Agent Platform (Python): Compila e implementa un agente de la API de Google Maps con Agent Runtime
Compila agentes conectándote a bases de datos Integración con AlloyDB y Cloud SQL para PostgreSQL Entrada de blog: Anunciamos LangChain en Agent Platform de Gemini Enterprise para AlloyDB y Cloud SQL para PostgreSQL

Notebook del SDK de Agent Platform (Python): Implementa una aplicación RAG con Cloud SQL para PostgreSQL en Agent Runtime

Notebook del SDK de Agent Platform (Python): Implementa una aplicación RAG con AlloyDB para PostgreSQL en Agent Runtime
Compila agentes con herramientas que acceden a los datos de tu base de datos. Notebook del SDK de Agent Platform (Python): Implementa un agente con Agent Runtime y MCP Toolbox para bases de datos
Consulta y comprende los almacenes de datos estructurados con lenguaje natural. Notebook del SDK de Agent Platform (Python): Compila un agente de búsqueda conversacional con Agent Runtime y RAG en Agent Search
Consulta y comprende bases de datos de grafos con lenguaje natural Entrada de blog: GenAI GraphRAG y agentes de IA que usan Agent Runtime con LangChain y Neo4j
Consulta y comprende almacenes de vectores con lenguaje natural Entrada de blog: Simplifica GenAI RAG con MongoDB Atlas y Agent Runtime
Compila agentes con el Kit de desarrollo de agentes Compila e implementa agentes con el Kit de desarrollo de agentes. Kit de desarrollo de agentes: Implementa en Agent Runtime
Compila agentes con frameworks de OSS Compila e implementa agentes con el framework de código abierto OneTwo. Entrada de blog: OneTwo y Agent Runtime: Explora el desarrollo avanzado de agentes de IA en Google Cloud
Compila e implementa agentes con el framework de código abierto LangGraph. Notebook del SDK de Agent Platform (Python): Compila e implementa una aplicación de LangGraph con Agent Runtime
Depuración y optimización de agentes Compila y realiza seguimientos de agentes mediante OpenTelemetry y Cloud Trace. Notebook del SDK de Agent Platform (Python): Agentes de depuración y optimización: Una guía de seguimiento en Agent Runtime
Crea sistemas multiagente con el protocolo A2A (vista previa) Compila agentes interoperables que se comuniquen y colaboren con otros agentes, independientemente de su framework. Para obtener más información, consulta la documentación del protocolo A2A.

Seguridad empresarial

Agent Runtime admite varias funciones para ayudarte a cumplir con los requisitos de seguridad empresarial, cumplir con las políticas de seguridad de tu organización y seguir las prácticas recomendadas de seguridad. Se admiten las siguientes funciones:

  • Controles del servicio de VPC: Agent Runtime admite Controles del servicio de VPC para fortalecer la seguridad de los datos y mitigar los riesgos de robo de datos. Cuando se configuran los Controles del servicio de VPC, el agente implementado conserva el acceso seguro a las APIs y los servicios de Google, como la API de BigQuery, la API de Cloud SQL Admin y la API de Agent Platform, lo que verifica el funcionamiento sin problemas dentro del perímetro definido. De manera fundamental, los Controles del servicio de VPC bloquean de manera eficaz todo el acceso público a Internet, lo que limita el movimiento de datos a los límites de la red autorizada y mejora significativamente la seguridad empresarial.

    Los Controles del servicio de VPC no son compatibles con la Puerta de enlace del agente. Sin embargo, puedes usar restricciones personalizadas de la política de la organización para restringir qué puertas de enlace se pueden asociar con tus agentes. Para obtener más información, consulta Enruta el tráfico a través de la Puerta de enlace del agente.

  • Interfaz de Private Service Connect: Para Agent Runtime, PSC-I permite que tus agentes interactúen con servicios alojados de forma privada en la VPC de un usuario. Para obtener más información, consulta Usa la interfaz de Private Service Connect con Agent Runtime.

  • Claves de encriptación administradas por el cliente (CMEK): Agent Runtime admite CMEK para proteger tus datos con tus propias claves de encriptación, lo que te otorga la propiedad y el control total de las claves que protegen tus datos en reposo en Google Cloud. Para obtener más información, consulta Agent Runtime CMEK.

  • Residencia de datos (DRZ): Agent Runtime admite la residencia de datos (DRZ) para garantizar que todos los datos en reposo se almacenen dentro de la región especificada.

  • HIPAA: Como parte de Agent Platform, Agent Runtime admite cargas de trabajo de HIPAA.

  • Transparencia de acceso: La Transparencia de acceso proporciona los registros que captan las acciones que realizan los empleados de Google cuando acceden a su contenido. Para obtener más información sobre cómo habilitar la Transparencia de acceso para Agent Runtime, consulta Transparencia de acceso en Agent Platform.

En la siguiente tabla, se muestran las funciones de seguridad empresarial compatibles con cada servicio de Agent Platform:

Función de seguridad Agent Runtime Sesiones Memory Bank Almacén de ejemplos Ejecución de código
Controles del servicio de VPC No
Claves de encriptación administradas por el cliente No
Residencia de datos (DRZ) en reposo No
HIPAA
Transparencia de acceso No No
Aprobación de acceso No No

Regiones admitidas

Consulta Ubicaciones para obtener una lista de las regiones admitidas para Agent Runtime.

Quota

Consulta Cuotas y límites del sistema para obtener información sobre las cuotas de Agent Runtime.

Precios

Hay un nivel gratuito disponible para Agent Runtime. Para obtener información sobre los precios de Agent Runtime, consulta Precios de Agent Platform de Gemini Enterprise pricing.

Migración al SDK basado en el cliente

El módulo agent_engines dentro del SDK de Agent Platform se está refactorizando a un diseño basado en el cliente por los siguientes motivos clave:

  • Para alinearse con el Kit de desarrollo de agentes (ADK) y el SDK de IA generativa de Google en representaciones de tipo canónico. Esto garantiza una forma coherente y estandarizada de representar tipos de datos en diferentes SDK, lo que simplifica la interoperabilidad y reduce la sobrecarga de conversión.
  • Para el alcance a nivel del cliente de los Google Cloud parámetros en aplicaciones multiregionales de varios proyectos. Esto permite que una aplicación administre interacciones con recursos en diferentes Google Cloud proyectos y ubicaciones geográficas mediante la configuración de cada instancia del cliente con su proyecto y configuración de ubicación específicos.
  • Para mejorar la visibilidad y la cohesión de los servicios de Agent Runtime

¿Qué sigue?

Guía

Configura tu entorno para usar el entorno de ejecución de Agent Platform.

Recurso

Obtén asistencia para el desarrollo de Agent Platform.