En este documento se proporciona una arquitectura de alto nivel para un sistema de IA con agentes que coordine las interacciones con sistemas empresariales dispares. Un agente orquestador automatiza procesos complejos y unifica el acceso a varios sistemas empresariales a través de interfaces conversacionales modernas. Estos sistemas pueden ser aplicaciones comerciales de terceros o sistemas internos propietarios. Este diseño elimina las integraciones de sistemas punto a punto, por lo que los operadores pueden evitar el cambio constante de contexto (procesamiento de silla giratoria).
Este documento está dirigido a arquitectos, desarrolladores y administradores que crean y gestionan aplicaciones de IA basadas en agentes en la nube. En este documento se presupone que tienes conocimientos básicos sobre la IA autónoma.
Arquitectura
En el siguiente diagrama se muestra una arquitectura de varias capas en la que un agente de orquestación usa la IA para enrutar las interacciones de los clientes de varios canales a los sistemas backend adecuados.
Los componentes de la arquitectura se organizan en las siguientes capas:
| Layer | Componentes |
|---|---|
| Canales de interacción | En la arquitectura de ejemplo, los clientes interactúan con el sistema de IA de agente a través de los siguientes canales:
|
| Núcleo agéntico | El componente principal de la arquitectura es un agente de orquestación creado con Agent Development Kit (ADK) y desplegado en Cloud Run. El orquestador gestiona un sistema multiagente. Esta plataforma sin servidor proporciona escalabilidad y control de acceso mediante Gestión de Identidades y Accesos (IAM) para la API REST del agente. Para mantener el estado en tareas de varios pasos, el agente usa la compatibilidad integrada con ADK para conservar los datos de estado en Vertex AI Session Service o en Cloud Storage. |
| Integración estandarizada con sistemas backend | Para la comunicación entre el agente y los sistemas backend, la arquitectura usa servidores del protocolo de contexto de modelo (MCP) que se despliegan en Cloud Run.
Cada servidor de MCP expone la API de un sistema backend específico como un conjunto de herramientas estandarizado. Los servidores de MCP forman una capa anticorrupción que aísla al agente de los sistemas backend. Este enfoque ayuda a evitar un acoplamiento estricto del agente con los sistemas backend. Simplifica la lógica del agente y te permite modernizar los sistemas backend de forma independiente al agente. |
| Sistemas de backend | En la arquitectura de ejemplo, el agente de IA coordina el acceso a los siguientes sistemas backend:
|
Productos usados
Esta arquitectura de ejemplo usa los siguientes productos de Google Cloud :
- Vertex AI: una plataforma de aprendizaje automático que te permite entrenar y desplegar modelos de aprendizaje automático y aplicaciones de IA, así como personalizar LLMs para usarlos en aplicaciones basadas en IA.
- Cloud Run: una plataforma de computación sin servidor que te permite ejecutar contenedores directamente en la infraestructura escalable de Google.
- Pub/Sub: un servicio de mensajería asíncrono y escalable que desacopla los servicios que producen mensajes de los servicios que los procesan.
- Gemini Enterprise: una plataforma segura y totalmente gestionada para desplegar y gestionar agentes de IA en una empresa.
- Gemini:familia de modelos de IA multimodales desarrollada por Google.
- Cloud Storage: un almacén de objetos ilimitado y a un coste bajo para diversos tipos de datos. Se puede acceder a los datos desde dentro y fuera de Google Cloud, y se replican en varias ubicaciones para ofrecer redundancia.
- Cloud SQL: un servicio de bases de datos relacionales totalmente gestionado que te ayuda a aprovisionar, operar y gestionar tus bases de datos MySQL, PostgreSQL y SQL Server en Google Cloud.
Casos prácticos
Esta arquitectura es útil en los siguientes casos prácticos:
- Automatizar el procesamiento de información entre aplicaciones externas e internas dispares.
- Crea una interfaz unificada para varios sistemas antiguos sin tener que hacer una migración a gran escala.
- Añade funciones inteligentes y conversacionales a los procesos empresariales.
- Moderniza tus aplicaciones de forma progresiva con funciones basadas en eventos.
La arquitectura ofrece las siguientes ventajas:
- Productividad: automatiza las tareas repetitivas para reducir los errores humanos y que tus equipos puedan centrarse en tareas de valor añadido.
- Escalabilidad: usa un enfoque basado en eventos para desarrollar, desplegar y escalar servicios de forma independiente.
- Experiencia de usuario mejorada: crea interfaces modernas y flexibles para integrar procesos empresariales complejos.
- Integración preparada para el futuro: estandariza la integración con los sistemas backend mediante servidores MCP para poder sustituir y actualizar los sistemas backend de forma independiente.
Factores del diseño
Para implementar esta arquitectura en producción, ten en cuenta las siguientes recomendaciones:
- Seguridad: en los servicios de Cloud Run, usa cuentas de servicio de IAM específicas con permisos basados en el principio de mínimos privilegios. Protege la API del agente configurando los controles de entrada de Cloud Run para restringir el acceso a las personas que llaman autenticadas.
- Observabilidad: en los sistemas distribuidos, el registro y el seguimiento son fundamentales para solucionar problemas. Para obtener visibilidad de todo el flujo de trabajo del agente, instrumenta tus servicios para escribir registros estructurados en Cloud Logging y emitir trazas en Cloud Trace.
- Rendimiento: Cloud Run se escala automáticamente en función de la demanda y se reduce a cero cuando no hay carga. En el caso de las aplicaciones sensibles a la latencia, puedes minimizar los inicios en frío configurando un número mínimo de instancias.
- Automatización del despliegue: automatiza el aprovisionamiento y la gestión de recursos mediante una herramienta de infraestructura como código (IaC) como Terraform. La IaC ayuda a asegurar que las implementaciones se puedan repetir y auditar en los entornos de desarrollo, de pruebas y de producción.
- Gobernanza: optimiza el diseño y el despliegue de la infraestructura de tu aplicación con Application Design Center. Puedes usar el centro de diseño de aplicaciones para definir plantillas que incorporen reglas de gobernanza y prácticas recomendadas para tu organización.
Siguientes pasos
- (Codelab) Despliega un servidor de MCP seguro en Cloud Run.
- (Codelab) Crea y despliega un agente que use un servidor de MCP en Cloud Run.
- (Codelab) Invoca de forma asíncrona una aplicación de IA de agente mediante eventos.
- (Curso de Google Skills) Crea agentes inteligentes con ADK.
- (Ejemplos de código) Descubre más ejemplos de código en GitHub para crear agentes con ADK.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos de las cargas de trabajo de IA y aprendizaje automático en Google Cloud, consulta la sección Perspectiva de IA y aprendizaje automático del framework Well-Architected.
Colaboradores
Autor: Casey West | Architecture Advocate, Google Cloud
Otros colaboradores:
- Amina Mansour | Responsable del equipo de evaluaciones de Cloud Platform
- Kumar Dhanagopal | Desarrollador de soluciones entre productos
- Leonid Yankulin | Ingeniero de relaciones con desarrolladores