Caso de uso da IA com agentes: orquestrar o acesso a sistemas empresariais diferentes

Este documento fornece uma arquitetura de alto nível para um sistema de IA agêntica que orquestra interações com sistemas empresariais distintos. Um agente orquestrador automatiza processos complexos e unifica o acesso a vários sistemas empresariais por meio de interfaces modernas e conversacionais. Esses sistemas podem ser aplicativos comerciais de terceiros ou sistemas internos reservados. Essa abordagem de design elimina as integrações de sistema ponto a ponto para que seus operadores evitem a troca constante de contexto (processamento de cadeira giratória).

O público-alvo deste documento inclui arquitetos, desenvolvedores e administradores que criam e gerenciam aplicativos de IA agêntica na nuvem. O documento pressupõe que você tenha uma compreensão básica da IA agêntica.

Arquitetura

O diagrama a seguir mostra uma arquitetura de várias camadas em que um agente orquestrador usa a IA para encaminhar interações de clientes de vários canais para sistemas de back-end adequados.

Arquitetura para um aplicativo de IA agêntica que organiza o acesso a sistemas empresariais diferentes. Arquitetura para um aplicativo de IA agêntica que organiza o acesso a sistemas empresariais diferentes.

Os componentes na arquitetura são organizados nas seguintes camadas:

Camada Componentes
Canais de interação

Na arquitetura de exemplo, os clientes interagem com o sistema de IA agêntica pelos seguintes canais:

  • Um front-end personalizado, como um aplicativo da Web que se comunica com o agente por uma API REST segura e oferece suporte a processos human-in-the-loop.
  • Uma interface de chat ad hoc no Gemini Enterprise que invoca o agente como uma ferramenta segura e permite que os usuários interajam com sistemas de back-end complexos usando linguagem natural.
  • Um aplicativo externo que inicia fluxos de trabalho de automação de sistema para sistema publicando eventos de negócios em um tópico do Pub/Sub.
Núcleo agêntico

O componente principal da arquitetura é um agente orquestrador criado com o Kit de Desenvolvimento de Agente (ADK) e implantado no Cloud Run. O orquestrador gerencia um sistema multiagente. Essa plataforma sem servidor oferece escalonabilidade e controle de acesso usando Identity and Access Management (IAM) para a API REST do agente.

Para manter o estado em tarefas de várias etapas, o agente usa o suporte integrado do ADK para manter os dados de estado no serviço de sessão da Vertex AI ou no Cloud Storage.

Integração padronizada com sistemas de back-end

Para a comunicação entre o agente e os sistemas de back-end, a arquitetura usa servidores do Protocolo de Contexto de Modelo (MCP) implantados no Cloud Run.

  • A MCP Toolbox para bancos de dados oferece um conjunto de ferramentas seguro e pronto para uso para acesso a bancos de dados como o Cloud SQL.
  • Os servidores MCP personalizados fornecem acesso aos aplicativos de back-end.

Cada servidor MCP expõe a API de um sistema de back-end específico como um conjunto padronizado de ferramentas. Os servidores MCP formam uma camada anticorrupção que isola o agente dos sistemas de back-end. Essa abordagem ajuda a evitar o acoplamento rígido do agente com os sistemas de back-end. Isso simplifica a lógica do agente e permite modernizar os sistemas de back-end de forma independente.

Sistemas de back-end

Na arquitetura de exemplo, o agente de IA orquestra o acesso aos seguintes sistemas de back-end:

  • Um banco de dados operacional no Cloud SQL.
  • Um aplicativo implantado em VMs do Compute Engine.
  • Um aplicativo que é executado fora do Google Cloud.

Produtos usados

Esta arquitetura de exemplo usa os seguintes produtos Google Cloud :

  • Vertex AI: uma plataforma de ML que permite treinar e implantar modelos de ML e aplicativos de IA, além de personalizar LLMs para uso em aplicativos com tecnologia de IA.
  • Cloud Run: uma plataforma de computação sem servidor que permite executar contêineres diretamente na infraestrutura escalonável do Google.
  • Pub/Sub: um serviço de mensagens assíncrono e escalonável que separa os serviços que produzem mensagens daqueles que processam essas mensagens.
  • Gemini Enterprise: uma plataforma segura totalmente gerenciada para implantar e gerenciar agentes de IA em uma empresa.
  • Gemini: uma família de modelos multimodais de IA desenvolvida pelo Google.
  • Cloud Storage: um repositório de objetos de baixo custo e sem limite para diversos tipos de dados. Os dados podem ser acessados de dentro e fora Google Cloude são replicados entre locais para redundância.
  • Cloud SQL: um serviço de banco de dados relacional totalmente gerenciado que ajuda a provisionar, operar e gerenciar seus bancos de dados MySQL, PostgreSQL e SQL Server no Google Cloud.

Casos de uso

Essa arquitetura é útil para os seguintes casos de uso:

  • Automatize o processamento de cadeira giratória entre aplicativos externos e internos disparados.
  • Crie uma interface unificada para vários sistemas legados sem uma migração em grande escala.
  • Adicione recursos inteligentes e de conversa aos processos de negócios atuais.
  • Modernize gradualmente seus aplicativos com funcionalidades orientadas a eventos.

A arquitetura oferece os seguintes benefícios:

  • Produtividade: automatize tarefas repetitivas para reduzir o erro humano e permitir que suas equipes se concentrem em atividades de valor agregado.
  • Escalonabilidade: use uma abordagem orientada a eventos para desenvolver, implantar e escalonar serviços de forma independente.
  • Experiência do usuário aprimorada: crie interfaces modernas e flexíveis para integrar processos de negócios complexos.
  • Integração à prova de futuro: padronize a integração com sistemas de back-end usando servidores MCP para substituir e fazer upgrade dos sistemas de back-end de forma independente.

Considerações sobre o design

Para implementar essa arquitetura em produção, considere as seguintes recomendações:

  • Segurança: para os serviços do Cloud Run, use contas de serviço dedicadas do IAM com permissões baseadas no princípio do privilégio mínimo. Proteja a API do agente configurando os controles de entrada do Cloud Run para restringir o acesso a chamadores autenticados.
  • Observabilidade: em sistemas distribuídos, a geração de registros e o rastreamento são essenciais para a solução de problemas. Para ter visibilidade de todo o fluxo de trabalho de agente, instrumente seus serviços para gravar registros estruturados no Cloud Logging e emitir rastreamentos no Cloud Trace.
  • Performance: o Cloud Run faz o escalonamento automático com base na demanda e reduz a zero quando não há carga. Para aplicativos sensíveis à latência, é possível minimizar as inicializações a frio configurando um número mínimo de instâncias.
  • Automação de implantação: automatize o provisionamento e o gerenciamento de recursos usando uma ferramenta de infraestrutura como código (IaC) como o Terraform. A IaC ajuda a garantir implantações repetíveis e auditáveis em desenvolvimento, teste e produção.
  • Governança: simplifique o design e a implantação da infraestrutura do aplicativo usando o App Design Center. Use o App Design Center para definir modelos que incorporam regras de governança e práticas recomendadas para sua organização.

A seguir

Colaboradores

Autor: Casey West | Mediador de arquitetura, Google Cloud

Outros colaboradores: