Caso práctico de IA de agentes: orquestar el acceso a sistemas empresariales dispares

En este documento se proporciona una arquitectura de alto nivel para un sistema de IA con agentes que coordine las interacciones con sistemas empresariales dispares. Un agente orquestador automatiza procesos complejos y unifica el acceso a varios sistemas empresariales a través de interfaces conversacionales modernas. Estos sistemas pueden ser aplicaciones comerciales de terceros o sistemas internos propietarios. Este diseño elimina las integraciones de sistemas punto a punto, por lo que los operadores pueden evitar el cambio constante de contexto (procesamiento de silla giratoria).

Este documento está dirigido a arquitectos, desarrolladores y administradores que crean y gestionan aplicaciones de IA basadas en agentes en la nube. En este documento se presupone que tienes conocimientos básicos sobre la IA autónoma.

Arquitectura

En el siguiente diagrama se muestra una arquitectura de varias capas en la que un agente de orquestación usa la IA para enrutar las interacciones de los clientes de varios canales a los sistemas backend adecuados.

Arquitectura de una aplicación de IA basada en agentes que coordina el acceso a sistemas empresariales dispares. Arquitectura de una aplicación de IA basada en agentes que coordina el acceso a sistemas empresariales dispares.

Los componentes de la arquitectura se organizan en las siguientes capas:

Layer Componentes
Canales de interacción

En la arquitectura de ejemplo, los clientes interactúan con el sistema de IA de agente a través de los siguientes canales:

  • Un frontend personalizado, como una aplicación web que se comunica con el agente a través de una API REST segura y admite procesos de intervención humana.
  • Una interfaz de chat ad hoc en Gemini Enterprise que invoca al agente como herramienta segura y permite a los usuarios interactuar con sistemas de backend complejos mediante lenguaje natural.
  • Una aplicación externa que inicia flujos de trabajo de automatización de sistema a sistema publicando eventos empresariales en un tema de Pub/Sub.
Núcleo agéntico

El componente principal de la arquitectura es un agente de orquestación creado con Agent Development Kit (ADK) y desplegado en Cloud Run. El orquestador gestiona un sistema multiagente. Esta plataforma sin servidor proporciona escalabilidad y control de acceso mediante Gestión de Identidades y Accesos (IAM) para la API REST del agente.

Para mantener el estado en tareas de varios pasos, el agente usa la compatibilidad integrada con ADK para conservar los datos de estado en Vertex AI Session Service o en Cloud Storage.

Integración estandarizada con sistemas backend

Para la comunicación entre el agente y los sistemas backend, la arquitectura usa servidores del protocolo de contexto de modelo (MCP) que se despliegan en Cloud Run.

  • MCP Toolbox for Databases proporciona un conjunto de herramientas seguras y listas para usar para acceder a bases de datos como Cloud SQL.
  • Los servidores de MCP personalizados proporcionan acceso a las aplicaciones de backend.

Cada servidor de MCP expone la API de un sistema backend específico como un conjunto de herramientas estandarizado. Los servidores de MCP forman una capa anticorrupción que aísla al agente de los sistemas backend. Este enfoque ayuda a evitar un acoplamiento estricto del agente con los sistemas backend. Simplifica la lógica del agente y te permite modernizar los sistemas backend de forma independiente al agente.

Sistemas de backend

En la arquitectura de ejemplo, el agente de IA coordina el acceso a los siguientes sistemas backend:

  • Una base de datos operativa en Cloud SQL.
  • Una aplicación desplegada en máquinas virtuales de Compute Engine.
  • Una aplicación que se ejecuta fuera de Google Cloud.

Productos usados

Esta arquitectura de ejemplo usa los siguientes productos de Google Cloud :

  • Vertex AI: una plataforma de aprendizaje automático que te permite entrenar y desplegar modelos de aprendizaje automático y aplicaciones de IA, así como personalizar LLMs para usarlos en aplicaciones basadas en IA.
  • Cloud Run: una plataforma de computación sin servidor que te permite ejecutar contenedores directamente en la infraestructura escalable de Google.
  • Pub/Sub: un servicio de mensajería asíncrono y escalable que desacopla los servicios que producen mensajes de los servicios que los procesan.
  • Gemini Enterprise: una plataforma segura y totalmente gestionada para desplegar y gestionar agentes de IA en una empresa.
  • Gemini:familia de modelos de IA multimodales desarrollada por Google.
  • Cloud Storage: un almacén de objetos ilimitado y a un coste bajo para diversos tipos de datos. Se puede acceder a los datos desde dentro y fuera de Google Cloud, y se replican en varias ubicaciones para ofrecer redundancia.
  • Cloud SQL: un servicio de bases de datos relacionales totalmente gestionado que te ayuda a aprovisionar, operar y gestionar tus bases de datos MySQL, PostgreSQL y SQL Server en Google Cloud.

Casos prácticos

Esta arquitectura es útil en los siguientes casos prácticos:

  • Automatizar el procesamiento de información entre aplicaciones externas e internas dispares.
  • Crea una interfaz unificada para varios sistemas antiguos sin tener que hacer una migración a gran escala.
  • Añade funciones inteligentes y conversacionales a los procesos empresariales.
  • Moderniza tus aplicaciones de forma progresiva con funciones basadas en eventos.

La arquitectura ofrece las siguientes ventajas:

  • Productividad: automatiza las tareas repetitivas para reducir los errores humanos y que tus equipos puedan centrarse en tareas de valor añadido.
  • Escalabilidad: usa un enfoque basado en eventos para desarrollar, desplegar y escalar servicios de forma independiente.
  • Experiencia de usuario mejorada: crea interfaces modernas y flexibles para integrar procesos empresariales complejos.
  • Integración preparada para el futuro: estandariza la integración con los sistemas backend mediante servidores MCP para poder sustituir y actualizar los sistemas backend de forma independiente.

Factores del diseño

Para implementar esta arquitectura en producción, ten en cuenta las siguientes recomendaciones:

  • Seguridad: en los servicios de Cloud Run, usa cuentas de servicio de IAM específicas con permisos basados en el principio de mínimos privilegios. Protege la API del agente configurando los controles de entrada de Cloud Run para restringir el acceso a las personas que llaman autenticadas.
  • Observabilidad: en los sistemas distribuidos, el registro y el seguimiento son fundamentales para solucionar problemas. Para obtener visibilidad de todo el flujo de trabajo del agente, instrumenta tus servicios para escribir registros estructurados en Cloud Logging y emitir trazas en Cloud Trace.
  • Rendimiento: Cloud Run se escala automáticamente en función de la demanda y se reduce a cero cuando no hay carga. En el caso de las aplicaciones sensibles a la latencia, puedes minimizar los inicios en frío configurando un número mínimo de instancias.
  • Automatización del despliegue: automatiza el aprovisionamiento y la gestión de recursos mediante una herramienta de infraestructura como código (IaC) como Terraform. La IaC ayuda a asegurar que las implementaciones se puedan repetir y auditar en los entornos de desarrollo, de pruebas y de producción.
  • Gobernanza: optimiza el diseño y el despliegue de la infraestructura de tu aplicación con Application Design Center. Puedes usar el centro de diseño de aplicaciones para definir plantillas que incorporen reglas de gobernanza y prácticas recomendadas para tu organización.

Siguientes pasos

Colaboradores

Autor: Casey West | Architecture Advocate, Google Cloud

Otros colaboradores: