Este documento fornece uma arquitetura de alto nível para um sistema de IA com agentes para orquestrar interações com sistemas empresariais distintos. Um agente de orquestração automatiza processos complexos e unifica o acesso a vários sistemas empresariais através de interfaces conversacionais modernas. Estes sistemas podem ser aplicações comerciais de terceiros ou sistemas internos proprietários. Esta abordagem de design elimina as integrações de sistemas ponto a ponto, para que os seus operadores possam evitar a alternância constante de contexto (processamento de cadeira giratória).
O público-alvo deste documento inclui arquitetos, programadores e administradores que criam e gerem aplicações de IA baseadas em agentes na nuvem. O documento pressupõe que tem uma compreensão fundamental da IA autónoma.
Arquitetura
O diagrama seguinte mostra uma arquitetura de várias camadas em que um agente de orquestração usa a IA para encaminhar as interações dos clientes de vários canais para os sistemas de back-end adequados.
Os componentes na arquitetura estão organizados nas seguintes camadas:
| Camada | Componentes |
|---|---|
| Canais de interação | Na arquitetura de exemplo, os clientes interagem com o sistema de IA baseado em agentes através dos seguintes vários canais:
|
| Núcleo agêntico | O componente principal da arquitetura é um agente orquestrador criado com o Agent Development Kit (ADK) e implementado no Cloud Run. O orquestrador gere um sistema multiagente. Esta plataforma sem servidor oferece escalabilidade e controlo de acesso através da gestão de identidade e de acesso (IAM) para a API REST do agente. Para manter o estado em tarefas de vários passos, o agente usa o suporte do ADK incorporado para persistir os dados de estado no Vertex AI Session Service ou no Cloud Storage. |
| Integração padronizada com sistemas de back-end | Para a comunicação entre o agente e os sistemas de back-end, a arquitetura usa servidores do Model Context Protocol (MCP) implementados no Cloud Run.
Cada servidor MCP expõe a API de um sistema de back-end específico como um conjunto de ferramentas padronizado. Os servidores MCP formam uma camada antifraude que isola o agente dos sistemas de back-end. Esta abordagem ajuda a evitar a união excessiva do agente com os sistemas de back-end. Simplifica a lógica do agente e permite-lhe modernizar os sistemas de back-end independentemente do agente. |
| Sistemas de back-end | Na arquitetura de exemplo, o agente de IA orquestra o acesso aos seguintes sistemas de back-end:
|
Produtos usados
Esta arquitetura de exemplo usa os seguintes Google Cloud produtos:
- Vertex AI: uma plataforma de ML que lhe permite preparar e implementar modelos de ML e aplicações de IA, bem como personalizar MDIs/CEs para utilização em aplicações com tecnologia de IA.
- Cloud Run: uma plataforma de computação sem servidor que lhe permite executar contentores diretamente na infraestrutura escalável da Google.
- Pub/Sub: um serviço de mensagens assíncrono e escalável que desacopla os serviços que produzem mensagens dos serviços que processam essas mensagens.
- Gemini Enterprise: uma plataforma segura totalmente gerida para implementar e gerir agentes de IA numa empresa.
- Gemini: uma família de modelos de IA multimodal desenvolvidos pela Google.
- Cloud Storage: um local de armazenamento de objetos de baixo custo e sem limite para diversos tipos de dados. Os dados podem ser acedidos a partir do interior e do exterior Google Cloud, e são replicados em várias localizações para redundância.
- Cloud SQL: um serviço de base de dados relacional totalmente gerido que ajuda a aprovisionar, operar e gerir as suas bases de dados MySQL, PostgreSQL e SQL Server no Google Cloud.
Exemplos de utilização
Esta arquitetura é útil para os seguintes exemplos de utilização:
- Automatize o processamento de cadeira giratória entre aplicações externas e internas disparates.
- Crie uma interface unificada para vários sistemas antigos sem uma migração em grande escala.
- Adicione capacidades inteligentes de conversação aos processos empresariais existentes.
- Modernize as suas aplicações de forma incremental com a funcionalidade orientada por eventos.
A arquitetura oferece as seguintes vantagens:
- Produtividade: automatize tarefas repetitivas para reduzir os erros humanos, para que as suas equipas se possam concentrar em tarefas de valor acrescentado.
- Escalabilidade: use uma abordagem orientada por eventos para desenvolver, implementar e dimensionar serviços de forma independente.
- Experiência do utilizador melhorada: crie interfaces modernas e flexíveis para integrar processos empresariais complexos.
- Integração preparada para o futuro: padronize a integração com sistemas de back-end através da utilização de servidores MCP para poder substituir e atualizar os sistemas de back-end de forma independente.
Considerações de design
Para implementar esta arquitetura para produção, considere as seguintes recomendações:
- Segurança: para os serviços do Cloud Run, use contas de serviço do IAM dedicadas com autorizações baseadas no princípio do menor privilégio. Proteja a API do agente configurando os controlos de entrada do Cloud Run para restringir o acesso a autores de chamadas autenticados.
- Observabilidade: nos sistemas distribuídos, o registo e o rastreio são essenciais para a resolução de problemas. Para ter visibilidade de todo o fluxo de trabalho do agente, instrumente os seus serviços para escrever registos estruturados no Cloud Logging e emitir rastreios para o Cloud Trace.
- Desempenho: o Cloud Run é dimensionado automaticamente com base na procura e é dimensionado para zero quando não existe carga. Para aplicações sensíveis à latência, pode minimizar os inícios a frio configurando um número mínimo de instâncias.
- Automatização da implementação: automatize o aprovisionamento e a gestão de recursos através de uma ferramenta de infraestrutura como código (IaC), como o Terraform. A IaC ajuda a garantir implementações repetíveis e auditáveis no desenvolvimento, na preparação e na produção.
- Governança: simplifique o design e a implementação da infraestrutura da sua aplicação através do Application Design Center. Pode usar o App Design Center para definir modelos que incorporam regras de governação e práticas recomendadas para a sua organização.
O que se segue?
- (Codelab) Implemente um servidor MCP seguro no Cloud Run.
- (Codelab) Crie e implemente um agente que usa um servidor MCP no Cloud Run.
- (Codelab) Invoque de forma assíncrona uma aplicação de IA com agentes através de eventos.
- (Curso Google Skills) Crie agentes inteligentes com o ADK.
- (Exemplos de código) Descubra mais exemplos de código no GitHub para criar agentes com o ADK.
- Para uma vista geral dos princípios e recomendações de arquitetura específicos das cargas de trabalho de IA e ML no Google Cloud, consulte a perspetiva de IA e ML no Well-Architected Framework.
Colaboradores
Autor: Casey West | Architecture Advocate, Google Cloud
Outros colaboradores:
- Amina Mansour | Head of Cloud Platform Evaluations Team
- Kumar Dhanagopal | Cross-Product Solution Developer
- Leonid Yankulin | Developer Relations Engineer