Exemplo de utilização da IA autónoma: orquestrar o acesso a sistemas empresariais distintos

Este documento fornece uma arquitetura de alto nível para um sistema de IA com agentes para orquestrar interações com sistemas empresariais distintos. Um agente de orquestração automatiza processos complexos e unifica o acesso a vários sistemas empresariais através de interfaces conversacionais modernas. Estes sistemas podem ser aplicações comerciais de terceiros ou sistemas internos proprietários. Esta abordagem de design elimina as integrações de sistemas ponto a ponto, para que os seus operadores possam evitar a alternância constante de contexto (processamento de cadeira giratória).

O público-alvo deste documento inclui arquitetos, programadores e administradores que criam e gerem aplicações de IA baseadas em agentes na nuvem. O documento pressupõe que tem uma compreensão fundamental da IA autónoma.

Arquitetura

O diagrama seguinte mostra uma arquitetura de várias camadas em que um agente de orquestração usa a IA para encaminhar as interações dos clientes de vários canais para os sistemas de back-end adequados.

Arquitetura para uma aplicação de IA baseada em agentes que orquestra o acesso a sistemas empresariais distintos. Arquitetura para uma aplicação de IA baseada em agentes que orquestra o acesso a sistemas empresariais distintos.

Os componentes na arquitetura estão organizados nas seguintes camadas:

Camada Componentes
Canais de interação

Na arquitetura de exemplo, os clientes interagem com o sistema de IA baseado em agentes através dos seguintes vários canais:

  • Um front-end personalizado, como uma aplicação Web que comunica com o agente através de uma API REST segura e suporta processos com intervenção humana.
  • Uma interface de chat ad hoc no Gemini Enterprise que invoca o agente como uma ferramenta segura e permite que os utilizadores interajam com sistemas de back-end complexos através da linguagem natural.
  • Uma aplicação externa que inicia fluxos de trabalho de automatização de sistema para sistema publicando eventos empresariais num tópico do Pub/Sub.
Núcleo agêntico

O componente principal da arquitetura é um agente orquestrador criado com o Agent Development Kit (ADK) e implementado no Cloud Run. O orquestrador gere um sistema multiagente. Esta plataforma sem servidor oferece escalabilidade e controlo de acesso através da gestão de identidade e de acesso (IAM) para a API REST do agente.

Para manter o estado em tarefas de vários passos, o agente usa o suporte do ADK incorporado para persistir os dados de estado no Vertex AI Session Service ou no Cloud Storage.

Integração padronizada com sistemas de back-end

Para a comunicação entre o agente e os sistemas de back-end, a arquitetura usa servidores do Model Context Protocol (MCP) implementados no Cloud Run.

  • A MCP Toolbox for Databases oferece um conjunto de ferramentas seguro e pronto a usar para aceder a bases de dados como o Cloud SQL.
  • Os servidores MCP personalizados oferecem acesso às aplicações de back-end.

Cada servidor MCP expõe a API de um sistema de back-end específico como um conjunto de ferramentas padronizado. Os servidores MCP formam uma camada antifraude que isola o agente dos sistemas de back-end. Esta abordagem ajuda a evitar a união excessiva do agente com os sistemas de back-end. Simplifica a lógica do agente e permite-lhe modernizar os sistemas de back-end independentemente do agente.

Sistemas de back-end

Na arquitetura de exemplo, o agente de IA orquestra o acesso aos seguintes sistemas de back-end:

  • Uma base de dados operacional no Cloud SQL.
  • Uma aplicação implementada em VMs do Compute Engine.
  • Uma aplicação que é executada fora Google Cloud.

Produtos usados

Esta arquitetura de exemplo usa os seguintes Google Cloud produtos:

  • Vertex AI: uma plataforma de ML que lhe permite preparar e implementar modelos de ML e aplicações de IA, bem como personalizar MDIs/CEs para utilização em aplicações com tecnologia de IA.
  • Cloud Run: uma plataforma de computação sem servidor que lhe permite executar contentores diretamente na infraestrutura escalável da Google.
  • Pub/Sub: um serviço de mensagens assíncrono e escalável que desacopla os serviços que produzem mensagens dos serviços que processam essas mensagens.
  • Gemini Enterprise: uma plataforma segura totalmente gerida para implementar e gerir agentes de IA numa empresa.
  • Gemini: uma família de modelos de IA multimodal desenvolvidos pela Google.
  • Cloud Storage: um local de armazenamento de objetos de baixo custo e sem limite para diversos tipos de dados. Os dados podem ser acedidos a partir do interior e do exterior Google Cloud, e são replicados em várias localizações para redundância.
  • Cloud SQL: um serviço de base de dados relacional totalmente gerido que ajuda a aprovisionar, operar e gerir as suas bases de dados MySQL, PostgreSQL e SQL Server no Google Cloud.

Exemplos de utilização

Esta arquitetura é útil para os seguintes exemplos de utilização:

  • Automatize o processamento de cadeira giratória entre aplicações externas e internas disparates.
  • Crie uma interface unificada para vários sistemas antigos sem uma migração em grande escala.
  • Adicione capacidades inteligentes de conversação aos processos empresariais existentes.
  • Modernize as suas aplicações de forma incremental com a funcionalidade orientada por eventos.

A arquitetura oferece as seguintes vantagens:

  • Produtividade: automatize tarefas repetitivas para reduzir os erros humanos, para que as suas equipas se possam concentrar em tarefas de valor acrescentado.
  • Escalabilidade: use uma abordagem orientada por eventos para desenvolver, implementar e dimensionar serviços de forma independente.
  • Experiência do utilizador melhorada: crie interfaces modernas e flexíveis para integrar processos empresariais complexos.
  • Integração preparada para o futuro: padronize a integração com sistemas de back-end através da utilização de servidores MCP para poder substituir e atualizar os sistemas de back-end de forma independente.

Considerações de design

Para implementar esta arquitetura para produção, considere as seguintes recomendações:

  • Segurança: para os serviços do Cloud Run, use contas de serviço do IAM dedicadas com autorizações baseadas no princípio do menor privilégio. Proteja a API do agente configurando os controlos de entrada do Cloud Run para restringir o acesso a autores de chamadas autenticados.
  • Observabilidade: nos sistemas distribuídos, o registo e o rastreio são essenciais para a resolução de problemas. Para ter visibilidade de todo o fluxo de trabalho do agente, instrumente os seus serviços para escrever registos estruturados no Cloud Logging e emitir rastreios para o Cloud Trace.
  • Desempenho: o Cloud Run é dimensionado automaticamente com base na procura e é dimensionado para zero quando não existe carga. Para aplicações sensíveis à latência, pode minimizar os inícios a frio configurando um número mínimo de instâncias.
  • Automatização da implementação: automatize o aprovisionamento e a gestão de recursos através de uma ferramenta de infraestrutura como código (IaC), como o Terraform. A IaC ajuda a garantir implementações repetíveis e auditáveis no desenvolvimento, na preparação e na produção.
  • Governança: simplifique o design e a implementação da infraestrutura da sua aplicação através do Application Design Center. Pode usar o App Design Center para definir modelos que incorporam regras de governação e práticas recomendadas para a sua organização.

O que se segue?

Colaboradores

Autor: Casey West | Architecture Advocate, Google Cloud

Outros colaboradores: