Caso de uso de la IA agentiva: Orquesta el acceso a sistemas empresariales dispares

En este documento, se proporciona una arquitectura de alto nivel para un sistema de IA basado en agentes que coordine las interacciones con diferentes sistemas empresariales. Un agente organizador automatiza procesos complejos y unifica el acceso a varios sistemas empresariales a través de interfaces modernas y conversacionales. Estos sistemas pueden ser aplicaciones comerciales de terceros o sistemas internos propios. Este enfoque de diseño elimina las integraciones de sistemas punto a punto, de modo que tus operadores pueden evitar el cambio constante de contexto (procesamiento de silla giratoria).

El público objetivo de este documento incluye arquitectos, desarrolladores y administradores que compilan y administran aplicaciones de IA basadas en agentes en la nube. En este documento, se supone que tienes conocimientos básicos sobre la IA agentiva.

Arquitectura

En el siguiente diagrama, se muestra una arquitectura de varias capas en la que un agente de orquestación usa IA para enrutar las interacciones del cliente desde varios canales a los sistemas de backend adecuados.

Arquitectura para una aplicación de IA basada en agentes que coordina el acceso a sistemas empresariales dispares. Arquitectura para una aplicación de IA basada en agentes que coordina el acceso a sistemas empresariales dispares.

Los componentes de la arquitectura se organizan en las siguientes capas:

Capa Componentes
Canales de interacción

En la arquitectura de ejemplo, los clientes interactúan con el sistema de IA basada en agentes a través de los siguientes canales múltiples:

  • Un frontend personalizado, como una aplicación web que se comunica con el agente a través de una API de REST segura y admite procesos con participación humana
  • Una interfaz de chat ad hoc en Gemini Enterprise que invoca al agente como una herramienta segura y permite a los usuarios interactuar con sistemas de backend complejos usando lenguaje natural.
  • Es una aplicación externa que inicia flujos de trabajo de automatización de sistema a sistema publicando eventos comerciales en un tema de Pub/Sub.
Núcleo de agente

El componente principal de la arquitectura es un agente de organización que se compila con el Kit de desarrollo de agentes (ADK) y se implementa en Cloud Run. El organizador administra un sistema multiagente. Esta plataforma sin servidores proporciona escalabilidad y control de acceso con Identity and Access Management (IAM) para la API de REST del agente.

Para mantener el estado en las tareas de varios pasos, el agente usa la compatibilidad integrada del ADK para conservar los datos de estado en Vertex AI Session Service o Cloud Storage.

Integración estandarizada con sistemas de backend

Para la comunicación entre el agente y los sistemas de backend, la arquitectura usa servidores del Protocolo de contexto del modelo (MCP) que se implementan en Cloud Run.

  • MCP Toolbox for Databases proporciona un conjunto de herramientas seguro y listo para usar para acceder a bases de datos como Cloud SQL.
  • Los servidores de MCP personalizados proporcionan acceso a las aplicaciones de backend.

Cada servidor de MCP expone la API de un sistema de backend específico como un conjunto estandarizado de herramientas. Los servidores de MCP forman una capa anticorrupción que aísla al agente de los sistemas de backend. Este enfoque ayuda a evitar el acoplamiento estrecho del agente con los sistemas de backend. Simplifica la lógica del agente y te permite modernizar los sistemas de backend independientemente del agente.

Sistemas de backend

En la arquitectura de ejemplo, el agente de IA coordina el acceso a los siguientes sistemas de backend:

  • Es una base de datos operativa en Cloud SQL.
  • Una aplicación implementada en VMs de Compute Engine
  • Una aplicación que se ejecuta fuera de Google Cloud.

Productos usados

En esta arquitectura de ejemplo, se usan los siguientes Google Cloud productos:

  • Vertex AI: Es una plataforma de AA que te permite entrenar y, también, implementar modelos de AA y aplicaciones de IA, y personalizar LLM para usarlos en aplicaciones impulsadas por IA.
  • Cloud Run es una plataforma de procesamiento administrada que te permite ejecutar contenedores directamente sobre la infraestructura escalable de Google.
  • Pub/Sub: Un servicio de mensajería asíncrona y escalable que separa los servicios que producen mensajes de servicios que procesan esos mensajes.
  • Gemini Enterprise: Es una plataforma segura y completamente administrada para implementar y administrar agentes de IA en una empresa.
  • Gemini: Es una familia de modelos de IA multimodales desarrollados por Google.
  • Cloud Storage: Un almacén de objetos de bajo costo y sin límites para varios tipos de datos. Se puede acceder a los datos desde y hacia Google Cloud, y estos se replican en las ubicaciones para aumentar la redundancia.
  • Cloud SQL: Un servicio de base de datos relacional completamente administrado que te ayuda a aprovisionar, operar y administrar tus bases de datos MySQL, PostgreSQL y SQL Server en Google Cloud.

Casos de uso

Esta arquitectura es útil para los siguientes casos de uso:

  • Automatizar el procesamiento de sillas giratorias entre aplicaciones externas e internas dispares
  • Crear una interfaz unificada para varios sistemas heredados sin una migración a gran escala
  • Agregar capacidades inteligentes y conversacionales a los procesos comerciales existentes
  • Moderniza tus aplicaciones de forma incremental con funciones basadas en eventos.

La arquitectura proporciona los siguientes beneficios:

  • Productividad: Automatiza las tareas repetitivas para reducir los errores humanos, de modo que tus equipos puedan enfocarse en tareas de valor agregado.
  • Escalabilidad: Usa un enfoque basado en eventos para desarrollar, implementar y escalar servicios de forma independiente.
  • Experiencia del usuario mejorada: Crea interfaces modernas y flexibles para integrar procesos comerciales complejos.
  • Integración a prueba del futuro: Estandariza la integración con los sistemas de backend usando servidores de MCP para que puedas reemplazar y actualizar los sistemas de backend de forma independiente.

Consideraciones del diseño

Para implementar esta arquitectura en producción, ten en cuenta las siguientes recomendaciones:

  • Seguridad: Para los servicios de Cloud Run, usa cuentas de servicio de IAM dedicadas con permisos basados en el principio de privilegio mínimo. Protege la API del agente configurando los controles de entrada de Cloud Run para restringir el acceso a los llamadores autenticados.
  • Observabilidad: En los sistemas distribuidos, el registro y el seguimiento son fundamentales para solucionar problemas. Para obtener visibilidad de todo el flujo de trabajo de los agentes, instrumenta tus servicios para escribir registros estructurados en Cloud Logging y emitir seguimientos en Cloud Trace.
  • Rendimiento: Cloud Run se ajusta automáticamente según la demanda y se reduce a cero cuando no hay carga. Para las aplicaciones sensibles a la latencia, puedes minimizar los inicios en frío configurando una cantidad mínima de instancias.
  • Automatización de la implementación: Automatiza el aprovisionamiento y la administración de recursos con una herramienta de infraestructura como código (IaC) como Terraform. La IaC ayuda a garantizar implementaciones repetibles y auditables en el desarrollo, la etapa de pruebas y la producción.
  • Administración: Optimiza el diseño y la implementación de la infraestructura de tu aplicación con App Design Center. Puedes usar el Centro de diseño de apps para definir plantillas que incorporen reglas de administración y prácticas recomendadas para tu organización.

¿Qué sigue?

Colaboradores

Autor: Casey West | Architecture Advocate, Google Cloud

Otros colaboradores: