Caso de uso da IA com agentes: orquestrar o acesso a sistemas empresariais diferentes

Este documento fornece uma arquitetura de alto nível para um sistema de IA de agente que orquestra interações com sistemas empresariais distintos. Um agente orquestrador automatiza processos complexos e unifica o acesso a vários sistemas empresariais por meio de interfaces modernas e conversacionais. Esses sistemas podem ser aplicativos comerciais de terceiros ou sistemas internos proprietários. Essa abordagem de design elimina as integrações de sistema ponto a ponto para que seus operadores evitem a troca constante de contexto (processamento de cadeira giratória).

O público-alvo deste documento inclui arquitetos, desenvolvedores e administradores que criam e gerenciam aplicativos de IA com agentes na nuvem. O documento pressupõe que você tenha uma compreensão básica da IA de agente.

Arquitetura

O diagrama a seguir mostra uma arquitetura de várias camadas em que um agente orquestrador usa a IA para encaminhar interações de clientes de vários canais para sistemas de back-end adequados.

Arquitetura para um aplicativo de IA com agentes que orquestra o acesso a sistemas empresariais diferentes. Arquitetura para um aplicativo de IA com agentes que organiza o acesso a sistemas empresariais diferentes.

Os componentes na arquitetura são organizados nas seguintes camadas:

Camada Componentes
Canais de interação

Na arquitetura de exemplo, os clientes interagem com o sistema de IA autônoma pelos seguintes canais:

  • Um front-end personalizado, como um aplicativo da Web que se comunica com o agente por uma API REST segura e oferece suporte a processos de humano no loop.
  • Uma interface de chat ad hoc no Gemini Enterprise que invoca o agente como uma ferramenta segura e permite que os usuários interajam com sistemas de back-end complexos usando linguagem natural.
  • Um aplicativo externo que inicia fluxos de trabalho de automação de sistema para sistema publicando eventos de negócios em um tópico do Pub/Sub.
Núcleo agêntico

O componente principal da arquitetura é um agente orquestrador criado com o Kit de Desenvolvimento de Agente (ADK) e implantado no Cloud Run. O orquestrador gerencia um sistema multiagente. Essa plataforma sem servidor oferece escalonabilidade e controle de acesso usando Identity and Access Management (IAM) para a API REST do agente.

Para manter o estado em tarefas de várias etapas, o agente usa o suporte integrado do ADK para manter os dados de estado no serviço de sessão da Vertex AI ou no Cloud Storage.

Integração padronizada com sistemas de back-end

Para a comunicação entre o agente e os sistemas de back-end, a arquitetura usa servidores do Protocolo de Contexto de Modelo (MCP) implantados no Cloud Run.

  • A MCP Toolbox para bancos de dados oferece um conjunto de ferramentas seguro e pronto para uso para acesso a bancos de dados como o Cloud SQL.
  • Os servidores MCP personalizados fornecem acesso aos aplicativos de back-end.

Cada servidor MCP expõe a API de um sistema de back-end específico como um conjunto padronizado de ferramentas. Os servidores MCP formam uma camada anticorrupção que isola o agente dos sistemas de back-end. Essa abordagem ajuda a evitar o acoplamento do agente com os sistemas de back-end. Isso simplifica a lógica do agente e permite modernizar os sistemas de back-end de forma independente.

Sistemas de back-end

Na arquitetura de exemplo, o agente de IA orquestra o acesso aos seguintes sistemas de back-end:

  • Um banco de dados operacional no Cloud SQL.
  • Um aplicativo implantado em VMs do Compute Engine.
  • Um aplicativo que é executado fora do Google Cloud.

Produtos usados

Esta arquitetura de exemplo usa os seguintes produtos Google Cloud :

  • Vertex AI: uma plataforma de ML que permite treinar e implantar modelos de ML e aplicativos de IA, além de personalizar LLMs para uso em aplicativos com tecnologia de IA.
  • Cloud Run: uma plataforma de computação sem servidor que permite executar contêineres diretamente na infraestrutura escalonável do Google.
  • Pub/Sub: um serviço de mensagens assíncrono e escalonável que separa os serviços que produzem mensagens daqueles que processam essas mensagens.
  • Gemini Enterprise: uma plataforma segura totalmente gerenciada para implantar e gerenciar agentes de IA em uma empresa.
  • Gemini: uma família de modelos multimodais de IA desenvolvida pelo Google.
  • Cloud Storage: um armazenamento de objetos de baixo custo e sem limite para diversos tipos de dados. Os dados podem ser acessados de dentro e fora Google Cloude são replicados entre locais para redundância.
  • Cloud SQL: um serviço de banco de dados relacional totalmente gerenciado que ajuda a provisionar, operar e gerenciar seus bancos de dados MySQL, PostgreSQL e SQL Server no Google Cloud.

Casos de uso

Essa arquitetura é útil para os seguintes casos de uso:

  • Automatize o processamento de cadeira giratória entre aplicativos externos e internos disparados.
  • Crie uma interface unificada para vários sistemas legados sem uma migração em grande escala.
  • Adicione recursos inteligentes e de conversa aos processos de negócios atuais.
  • Modernize gradualmente seus aplicativos com funcionalidades orientadas a eventos.

A arquitetura oferece os seguintes benefícios:

  • Produtividade: automatize tarefas repetitivas para reduzir o erro humano e permitir que suas equipes se concentrem em atividades de valor agregado.
  • Escalonabilidade: use uma abordagem orientada a eventos para desenvolver, implantar e escalonar serviços de forma independente.
  • Experiência do usuário aprimorada: crie interfaces modernas e flexíveis para integrar processos de negócios complexos.
  • Integração à prova de futuro: padronize a integração com sistemas de back-end usando servidores MCP para substituir e fazer upgrade dos sistemas de back-end de forma independente.

Considerações sobre o design

Para implementar essa arquitetura em produção, considere as seguintes recomendações:

  • Segurança: para os serviços do Cloud Run, use contas de serviço dedicadas do IAM com permissões baseadas no princípio do privilégio mínimo. Proteja a API do agente configurando os controles de entrada do Cloud Run para restringir o acesso a chamadores autenticados.
  • Observabilidade: em sistemas distribuídos, a geração de registros e o rastreamento são essenciais para a solução de problemas. Para ter visibilidade de todo o fluxo de trabalho de agente, instrumente seus serviços para gravar registros estruturados no Cloud Logging e emitir rastreamentos no Cloud Trace.
  • Performance: o Cloud Run faz o escalonamento automático com base na demanda e reduz a zero quando não há carga. Para aplicativos sensíveis à latência, é possível minimizar as inicializações a frio configurando um número mínimo de instâncias.
  • Automação de implantação: automatize o provisionamento e o gerenciamento de recursos usando uma ferramenta de infraestrutura como código (IaC) como o Terraform. A IaC ajuda a garantir implantações repetíveis e auditáveis em desenvolvimento, preparação e produção.
  • Governança: simplifique o design e a implantação da infraestrutura do aplicativo usando o App Design Center. Use o App Design Center para definir modelos que incorporam regras de governança e práticas recomendadas para sua organização.

A seguir

Colaboradores

Autor: Casey West | Mediador de arquitetura, Google Cloud

Outros colaboradores: