En este documento, se proporciona una arquitectura de alto nivel para un sistema de IA basado en agentes que coordine las interacciones con diferentes sistemas empresariales. Un agente organizador automatiza procesos complejos y unifica el acceso a varios sistemas empresariales a través de interfaces modernas y conversacionales. Estos sistemas pueden ser aplicaciones comerciales de terceros o sistemas internos propios. Este enfoque de diseño elimina las integraciones de sistemas punto a punto, de modo que tus operadores pueden evitar el cambio constante de contexto (procesamiento de silla giratoria).
El público objetivo de este documento incluye arquitectos, desarrolladores y administradores que compilan y administran aplicaciones de IA basadas en agentes en la nube. En este documento, se supone que tienes conocimientos básicos sobre la IA agentiva.
Arquitectura
En el siguiente diagrama, se muestra una arquitectura de varias capas en la que un agente de orquestación usa IA para enrutar las interacciones del cliente desde varios canales a los sistemas de backend adecuados.
Los componentes de la arquitectura se organizan en las siguientes capas:
| Capa | Componentes |
|---|---|
| Canales de interacción | En la arquitectura de ejemplo, los clientes interactúan con el sistema de IA basada en agentes a través de los siguientes canales múltiples:
|
| Núcleo de agente | El componente principal de la arquitectura es un agente de organización que se compila con el Kit de desarrollo de agentes (ADK) y se implementa en Cloud Run. El organizador administra un sistema multiagente. Esta plataforma sin servidores proporciona escalabilidad y control de acceso con Identity and Access Management (IAM) para la API de REST del agente. Para mantener el estado en las tareas de varios pasos, el agente usa la compatibilidad integrada del ADK para conservar los datos de estado en Vertex AI Session Service o Cloud Storage. |
| Integración estandarizada con sistemas de backend | Para la comunicación entre el agente y los sistemas de backend, la arquitectura usa servidores del Protocolo de contexto del modelo (MCP) que se implementan en Cloud Run.
Cada servidor de MCP expone la API de un sistema de backend específico como un conjunto estandarizado de herramientas. Los servidores de MCP forman una capa anticorrupción que aísla al agente de los sistemas de backend. Este enfoque ayuda a evitar el acoplamiento estrecho del agente con los sistemas de backend. Simplifica la lógica del agente y te permite modernizar los sistemas de backend independientemente del agente. |
| Sistemas de backend | En la arquitectura de ejemplo, el agente de IA coordina el acceso a los siguientes sistemas de backend:
|
Productos usados
En esta arquitectura de ejemplo, se usan los siguientes Google Cloud productos:
- Vertex AI: Es una plataforma de AA que te permite entrenar y, también, implementar modelos de AA y aplicaciones de IA, y personalizar LLM para usarlos en aplicaciones impulsadas por IA.
- Cloud Run es una plataforma de procesamiento administrada que te permite ejecutar contenedores directamente sobre la infraestructura escalable de Google.
- Pub/Sub: Un servicio de mensajería asíncrona y escalable que separa los servicios que producen mensajes de servicios que procesan esos mensajes.
- Gemini Enterprise: Es una plataforma segura y completamente administrada para implementar y administrar agentes de IA en una empresa.
- Gemini: Es una familia de modelos de IA multimodales desarrollados por Google.
- Cloud Storage: Un almacén de objetos de bajo costo y sin límites para varios tipos de datos. Se puede acceder a los datos desde y hacia Google Cloud, y estos se replican en las ubicaciones para aumentar la redundancia.
- Cloud SQL: Un servicio de base de datos relacional completamente administrado que te ayuda a aprovisionar, operar y administrar tus bases de datos MySQL, PostgreSQL y SQL Server en Google Cloud.
Casos de uso
Esta arquitectura es útil para los siguientes casos de uso:
- Automatizar el procesamiento de sillas giratorias entre aplicaciones externas e internas dispares
- Crear una interfaz unificada para varios sistemas heredados sin una migración a gran escala
- Agregar capacidades inteligentes y conversacionales a los procesos comerciales existentes
- Moderniza tus aplicaciones de forma incremental con funciones basadas en eventos.
La arquitectura proporciona los siguientes beneficios:
- Productividad: Automatiza las tareas repetitivas para reducir los errores humanos, de modo que tus equipos puedan enfocarse en tareas de valor agregado.
- Escalabilidad: Usa un enfoque basado en eventos para desarrollar, implementar y escalar servicios de forma independiente.
- Experiencia del usuario mejorada: Crea interfaces modernas y flexibles para integrar procesos comerciales complejos.
- Integración a prueba del futuro: Estandariza la integración con los sistemas de backend usando servidores de MCP para que puedas reemplazar y actualizar los sistemas de backend de forma independiente.
Consideraciones del diseño
Para implementar esta arquitectura en producción, ten en cuenta las siguientes recomendaciones:
- Seguridad: Para los servicios de Cloud Run, usa cuentas de servicio de IAM dedicadas con permisos basados en el principio de privilegio mínimo. Protege la API del agente configurando los controles de entrada de Cloud Run para restringir el acceso a los llamadores autenticados.
- Observabilidad: En los sistemas distribuidos, el registro y el seguimiento son fundamentales para solucionar problemas. Para obtener visibilidad de todo el flujo de trabajo de los agentes, instrumenta tus servicios para escribir registros estructurados en Cloud Logging y emitir seguimientos en Cloud Trace.
- Rendimiento: Cloud Run se ajusta automáticamente según la demanda y se reduce a cero cuando no hay carga. Para las aplicaciones sensibles a la latencia, puedes minimizar los inicios en frío configurando una cantidad mínima de instancias.
- Automatización de la implementación: Automatiza el aprovisionamiento y la administración de recursos con una herramienta de infraestructura como código (IaC) como Terraform. La IaC ayuda a garantizar implementaciones repetibles y auditables en el desarrollo, la etapa de pruebas y la producción.
- Administración: Optimiza el diseño y la implementación de la infraestructura de tu aplicación con App Design Center. Puedes usar el Centro de diseño de apps para definir plantillas que incorporen reglas de administración y prácticas recomendadas para tu organización.
¿Qué sigue?
- (Codelab) Implementa un servidor de MCP seguro en Cloud Run.
- (Codelab) Compila e implementa un agente que use un servidor de MCP en Cloud Run.
- (Codelab) Invoca de forma asíncrona una aplicación de IA basada en agentes con eventos.
- (Curso de Google Skills) Build intelligent agents with ADK
- (Muestras de código) Descubre más muestras de código en GitHub para compilar agentes con el ADK.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos para las cargas de trabajo de IA y AA en Google Cloud, consulta la perspectiva de IA y AA en Well-Architected Framework.
Colaboradores
Autor: Casey West | Architecture Advocate, Google Cloud
Otros colaboradores:
- Amina Mansour | Jefa del equipo de evaluaciones de Cloud Platform
- Autor: Kumar Dhanagopal | Desarrollador de soluciones entre productos
- Leonid Yankulin | Ingeniero de relaciones con desarrolladores