Este documento fornece uma arquitetura de alto nível para um sistema de IA de agente que orquestra interações com sistemas empresariais distintos. Um agente orquestrador automatiza processos complexos e unifica o acesso a vários sistemas empresariais por meio de interfaces modernas e conversacionais. Esses sistemas podem ser aplicativos comerciais de terceiros ou sistemas internos proprietários. Essa abordagem de design elimina as integrações de sistema ponto a ponto para que seus operadores evitem a troca constante de contexto (processamento de cadeira giratória).
O público-alvo deste documento inclui arquitetos, desenvolvedores e administradores que criam e gerenciam aplicativos de IA com agentes na nuvem. O documento pressupõe que você tenha uma compreensão básica da IA de agente.
Arquitetura
O diagrama a seguir mostra uma arquitetura de várias camadas em que um agente orquestrador usa a IA para encaminhar interações de clientes de vários canais para sistemas de back-end adequados.
Os componentes na arquitetura são organizados nas seguintes camadas:
| Camada | Componentes |
|---|---|
| Canais de interação | Na arquitetura de exemplo, os clientes interagem com o sistema de IA autônoma pelos seguintes canais:
|
| Núcleo agêntico | O componente principal da arquitetura é um agente orquestrador criado com o Kit de Desenvolvimento de Agente (ADK) e implantado no Cloud Run. O orquestrador gerencia um sistema multiagente. Essa plataforma sem servidor oferece escalonabilidade e controle de acesso usando Identity and Access Management (IAM) para a API REST do agente. Para manter o estado em tarefas de várias etapas, o agente usa o suporte integrado do ADK para manter os dados de estado no serviço de sessão da Vertex AI ou no Cloud Storage. |
| Integração padronizada com sistemas de back-end | Para a comunicação entre o agente e os sistemas de back-end, a arquitetura usa servidores do Protocolo de Contexto de Modelo (MCP) implantados no Cloud Run.
Cada servidor MCP expõe a API de um sistema de back-end específico como um conjunto padronizado de ferramentas. Os servidores MCP formam uma camada anticorrupção que isola o agente dos sistemas de back-end. Essa abordagem ajuda a evitar o acoplamento do agente com os sistemas de back-end. Isso simplifica a lógica do agente e permite modernizar os sistemas de back-end de forma independente. |
| Sistemas de back-end | Na arquitetura de exemplo, o agente de IA orquestra o acesso aos seguintes sistemas de back-end:
|
Produtos usados
Esta arquitetura de exemplo usa os seguintes produtos Google Cloud :
- Vertex AI: uma plataforma de ML que permite treinar e implantar modelos de ML e aplicativos de IA, além de personalizar LLMs para uso em aplicativos com tecnologia de IA.
- Cloud Run: uma plataforma de computação sem servidor que permite executar contêineres diretamente na infraestrutura escalonável do Google.
- Pub/Sub: um serviço de mensagens assíncrono e escalonável que separa os serviços que produzem mensagens daqueles que processam essas mensagens.
- Gemini Enterprise: uma plataforma segura totalmente gerenciada para implantar e gerenciar agentes de IA em uma empresa.
- Gemini: uma família de modelos multimodais de IA desenvolvida pelo Google.
- Cloud Storage: um armazenamento de objetos de baixo custo e sem limite para diversos tipos de dados. Os dados podem ser acessados de dentro e fora Google Cloude são replicados entre locais para redundância.
- Cloud SQL: um serviço de banco de dados relacional totalmente gerenciado que ajuda a provisionar, operar e gerenciar seus bancos de dados MySQL, PostgreSQL e SQL Server no Google Cloud.
Casos de uso
Essa arquitetura é útil para os seguintes casos de uso:
- Automatize o processamento de cadeira giratória entre aplicativos externos e internos disparados.
- Crie uma interface unificada para vários sistemas legados sem uma migração em grande escala.
- Adicione recursos inteligentes e de conversa aos processos de negócios atuais.
- Modernize gradualmente seus aplicativos com funcionalidades orientadas a eventos.
A arquitetura oferece os seguintes benefícios:
- Produtividade: automatize tarefas repetitivas para reduzir o erro humano e permitir que suas equipes se concentrem em atividades de valor agregado.
- Escalonabilidade: use uma abordagem orientada a eventos para desenvolver, implantar e escalonar serviços de forma independente.
- Experiência do usuário aprimorada: crie interfaces modernas e flexíveis para integrar processos de negócios complexos.
- Integração à prova de futuro: padronize a integração com sistemas de back-end usando servidores MCP para substituir e fazer upgrade dos sistemas de back-end de forma independente.
Considerações sobre o design
Para implementar essa arquitetura em produção, considere as seguintes recomendações:
- Segurança: para os serviços do Cloud Run, use contas de serviço dedicadas do IAM com permissões baseadas no princípio do privilégio mínimo. Proteja a API do agente configurando os controles de entrada do Cloud Run para restringir o acesso a chamadores autenticados.
- Observabilidade: em sistemas distribuídos, a geração de registros e o rastreamento são essenciais para a solução de problemas. Para ter visibilidade de todo o fluxo de trabalho de agente, instrumente seus serviços para gravar registros estruturados no Cloud Logging e emitir rastreamentos no Cloud Trace.
- Performance: o Cloud Run faz o escalonamento automático com base na demanda e reduz a zero quando não há carga. Para aplicativos sensíveis à latência, é possível minimizar as inicializações a frio configurando um número mínimo de instâncias.
- Automação de implantação: automatize o provisionamento e o gerenciamento de recursos usando uma ferramenta de infraestrutura como código (IaC) como o Terraform. A IaC ajuda a garantir implantações repetíveis e auditáveis em desenvolvimento, preparação e produção.
- Governança: simplifique o design e a implantação da infraestrutura do aplicativo usando o App Design Center. Use o App Design Center para definir modelos que incorporam regras de governança e práticas recomendadas para sua organização.
A seguir
- (Codelab) Implantar um servidor MCP seguro no Cloud Run.
- (Codelab) Criar e implantar um agente que usa um servidor MCP no Cloud Run.
- (Codelab) Invocar de forma assíncrona um aplicativo de IA com agente usando eventos.
- (Curso do Google Skills) Crie agentes inteligentes com o ADK.
- (Exemplos de código) Descubra mais exemplos de código no GitHub para criar agentes com o ADK.
- Para uma visão geral dos princípios e recomendações de arquitetura específicos para cargas de trabalho de IA e ML no Google Cloud, consulte a perspectiva de IA e ML no framework bem arquitetado.
Colaboradores
Autor: Casey West | Mediador de arquitetura, Google Cloud
Outros colaboradores:
- Amina Mansour | Líder da equipe de avaliações do Cloud Platform
- Kumar Dhanagopal | Desenvolvedor de soluções para vários produtos
- Leonid Yankulin | Engenheiro de relações com desenvolvedores