Visão geral do Vertex AI Agent Engine

O Vertex AI Agent Engine, que faz parte da plataforma Vertex AI, é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e dimensionar agentes de IA em produção. O Agent Engine cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Vertex AI Agent Engine oferece os seguintes serviços que podem ser usados individualmente ou em combinação:

  • Ambiente de execução:

    • Implante e escalone agentes com um ambiente de execução gerenciado e recursos de gerenciamento completos.
    • Personalize a imagem do contêiner do agente com scripts de instalação no momento da criação para dependências do sistema.
    • Use recursos de segurança, incluindo o compliance com o VPC-SC, configuração de autenticação e o IAM.
    • Acesse modelos e ferramentas com chamadas de função.
    • Implante agentes criados usando diferentes frameworks do Python e o protocolo aberto Agent2Agent.
  • Qualidade e avaliação (visualização): avalie a qualidade do agente com o serviço de avaliação de IA generativa integrado e otimize os agentes com execuções treinamento de modelo Gemini.

  • **Sessões**: as sessões do Agent Engine permitem armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.

  • Banco de memória: o banco de memória do Agent Engine permite armazenar e recuperar informações de sessões para personalizar interações do agente.

  • Execução de código: a execução de código do Agent Engine permite que o agente execute o código em um ambiente de sandbox seguro, isolado e gerenciado.

  • Exemplo de repositório (visualização): armazene e recupere dinamicamente exemplos few-shot para melhorar o desempenho do agente.

  • Observabilidade: entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), Cloud Monitoring e Cloud Logging.

  • Governança: o Vertex AI Agent Engine oferece suporte a vários recursos para ajudar você a governar agentes em produção e atender às necessidades de segurança e corporativas:

    • Detectar ameaças com o Security Command Center: Detecção de ameaças do Agent Engine (visualização) é um serviço integrado do Security Command Center que ajuda a detectar e investigar possíveis ataques a agentes implantados no ambiente de execução do Vertex AI Agent Engine.

    • Identidade do agente (visualização): Use a identidade do agente do Identity Access Management (IAM) para fornecer recursos de segurança e gerenciamento de acesso ao usar agentes no ambiente de execução do Vertex AI Agent Engine.

Visão geral conceitual do Agent Engine da Vertex AI

O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de recursos para descobrir, criar e implantar agentes de IA.

Criar e implantar no Vertex AI Agent Engine

Observação:para uma experiência de desenvolvimento e implantação simplificada e baseada em IDE com o Vertex AI Agent Engine, considere o pacote inicial do agente. Ele oferece modelos prontos para uso, uma UI integrada para experimentação e simplifica a implantação, as operações, a avaliação, a personalização e a observabilidade.

O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é:

Etapas Descrição
1. configurar o ambiente Configure o projeto do Google e instale a versão mais recente do SDK da Vertex AI para Python.
2. Desenvolver um agente Desenvolva um agente que possa ser implantado no Vertex AI Agent Engine.
3. Implantar o agente Implante o agente no ambiente de execução gerenciado do Vertex AI Agent Engine.
4. Usar o agente Consulte o agente enviando uma solicitação de API.
5. Gerenciar o agente implantado Gerencie e exclua os agentes que você implantou no Vertex AI Agent Engine.

As etapas estão ilustradas no diagrama a seguir:

Criar e implantar um agente 

Frameworks compatíveis

A tabela a seguir descreve o nível de suporte que o Vertex AI Agent Engine oferece para vários frameworks de agentes:

Nível de suporte Frameworks de agentes
Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no Vertex AI Agent Engine do seu framework. CrewAI, frameworks personalizados
Integração do SDK da Vertex AI: o Vertex AI Agent Engine fornece modelos gerenciados por framework no SDK e na documentação da Vertex AI. AG2, LlamaIndex
Integração completa: os recursos são integrados para funcionar em todo o framework, o Vertex AI Agent Engine e o ecossistema mais amplo Google Cloud . Kit de Desenvolvimento de Agente (ADK), LangChain, LangGraph

Implantar em produção com o pacote inicial do agente

O pacote inicial do agente é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O pacote inicial do agente oferece o seguinte:

  • Modelos de agentes pré-criados: ReAct, RAG, multiagente e outros modelos.
  • Playground interativo: teste e interaja com seu agente.
  • Infraestrutura automatizada: usa o Terraform para gerenciamento de recursos simplificado.
  • Pipelines de CI/CD: fluxos de trabalho de implantação automatizados que aproveitam o Cloud Build.
  • Observabilidade: suporte integrado para Cloud Trace e Cloud Logging.

Para começar, consulte o Guia de início rápido.

Casos de uso

Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:

Caso de uso Descrição Links
Criar agentes conectando-se a APIs públicas Converta entre moedas.

Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?"
Notebook do SDK da Vertex AI para Python: introdução à criação e implantação de um agente com o Vertex AI Agent Engine
Projetando um projeto solar comunitário.

Identifique locais potenciais procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares.
Notebook do SDK da Vertex AI para Python: como criar e implantar um agente da API Google Maps com o Vertex AI Agent Engine
Criar agentes conectando-se a bancos de dados Integração com o AlloyDB e o Cloud SQL para PostgreSQL. Postagem do blog: anúncio do LangChain no Vertex AI Agent Builder para AlloyDB e Cloud SQL para PostgreSQL

Notebook do SDK da Vertex AI para Python: implantação de um aplicativo RAG com o Cloud SQL para PostgreSQL no Vertex AI Agent Engine

Notebook do SDK da Vertex AI para Python: implantação de um aplicativo RAG com o AlloyDB para PostgreSQL no Vertex AI Agent Engine
Crie agentes com ferramentas que acessam dados no seu banco de dados. Notebook do SDK da Vertex AI para Python: implantação de um agente com o Vertex AI Agent Engine e a caixa de ferramentas MCP para bancos de dados
Consultar e entender repositórios de dados estruturados usando linguagem natural. Notebook do SDK da Vertex AI para Python: como criar um agente de pesquisa de conversação com o Vertex AI Agent Engine e a RAG na Vertex AI para Pesquisa
Consulte e entenda bancos de dados de gráficos usando linguagem natural Postagem do blog: GenAI GraphRAG e agentes de IA usando o Vertex AI Agent Engine com o LangChain e o Neo4j
Consultar e entender repositórios de vetores usando linguagem natural Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Vertex AI Agent Engine
Criar agentes com o Kit de Desenvolvimento de Agente Crie e implante agentes usando o Kit de Desenvolvimento de Agente. Kit de Desenvolvimento de Agente: implantação no Vertex AI Agent Engine
Criar agentes com frameworks de OSS Crie e implante agentes usando o framework de código aberto OneTwo. Postagem do blog: OneTwo e Vertex AI Agent Engine: explorando o desenvolvimento avançado de agentes de IA no Google Cloud
Crie e implante agentes usando o framework de código aberto LangGraph. Notebook do SDK da Vertex AI para Python: criar e implantar um aplicativo LangGraph com o Vertex AI Agent Engine
Depuração e otimização de agentes Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace. Notebook do SDK da Vertex AI para Python: depuração e otimização de agentes: um guia de rastreamento no Vertex AI Agent Engine
Criar sistemas multiagente com o protocolo A2A (visualização) Crie agentes interoperáveis que se comunicam e colaboram com outros agentes, independentemente do framework. Para mais informações, consulte a documentação do protocolo A2A.

Segurança corporativa

O Vertex AI Agent Engine oferece suporte a vários recursos para ajudar você a atender aos requisitos de segurança corporativa, aderir às políticas de segurança da sua organização e seguir as práticas recomendadas de segurança. Os seguintes recursos são compatíveis:

  • VPC Service Controls: o Vertex AI Agent Engine oferece suporte ao VPC Service Controls para fortalecer a segurança de dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls está configurado, o agente implantado mantém o acesso seguro às APIs e serviços do Google, como a API BigQuery, a API Cloud SQL Admin e a API Vertex AI, verificando a operação perfeita dentro do perímetro definido. Criticamente, o VPC Service Controls bloqueia efetivamente todo o acesso público à Internet, confinando a movimentação de dados aos limites de rede autorizados e aprimorando significativamente a postura de segurança da empresa.

  • Interface do Private Service Connect: para o ambiente de execução do Vertex AI Agent Engine, o PSC-I permite que os agentes interajam com serviços hospedados de forma privada na VPC de um usuário. Para mais informações, consulte Como usar a interface do Private Service Connect com o Vertex AI Agent Engine.

  • Chaves de criptografia gerenciadas pelo cliente (CMEK): o Vertex AI Agent Engine oferece suporte à CMEK para proteger seus dados com suas próprias chaves de criptografia, o que oferece propriedade e controle total das chaves que protegem seus dados em repouso no Google Cloud. Para mais informações, consulte CMEK do Agent Engine.

  • Residência de dados (DRZ): o Vertex AI Agent Engine oferece suporte à residência de dados (DRZ) para garantir que todos os dados em repouso sejam armazenados na região especificada.

  • HIPAA: como parte da plataforma Vertex AI, o Vertex AI Agent Engine oferece suporte a cargas de trabalho HIPAA.

  • Transparência no acesso: a transparência no acesso fornece registros que capturam as ações executadas pela equipe do Google ao acessar seu conteúdo. Para mais informações sobre como ativar a transparência no acesso para o Vertex AI Agent Engine, consulte Transparência no acesso na Vertex AI.

A tabela a seguir mostra quais recursos de segurança corporativa são compatíveis com cada serviço do Agent Engine:

Recurso de segurança Ambiente de execução Sessões Banco de memória Exemplo de repositório Execução de código
VPC Service Controls Sim Sim Sim Não Sim
Chaves de criptografia gerenciadas pelo cliente Sim Sim Sim Não Sim
Residência de dados (DRZ) em repouso Sim Sim Sim Não Sim
HIPAA Sim Sim Sim Sim Sim
Transparência no acesso Sim Sim Sim Não Não
Aprovação de acesso Sim Sim Sim Não Não

Regiões compatíveis

Consulte Locais para conferir uma lista de regiões compatíveis com o Vertex AI Agent Engine.

Quota

Consulte Cotas e limites do sistema para informações sobre a cota do Vertex AI Agent Engine.

Preços

Um nível sem custo financeiro está disponível para o ambiente de execução do Vertex AI Agent Engine.

Para informações sobre preços do ambiente de execução do Agent Engine, consulte Preços da Vertex AI.

Migração para o SDK baseado no cliente

O módulo agent_engines no SDK da Vertex AI para Python está sendo refatorado para um design baseado no cliente pelos seguintes motivos principais:

  • Para se alinhar ao ADK do Google e ao SDK de IA generativa do Google em representações de tipo canônico. Isso garante uma maneira consistente e padronizada de representar tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz a sobrecarga de conversão.
  • Para o escopo de Google Cloud parâmetros no nível do cliente em aplicativos de vários projetos e locais. Isso permite que um aplicativo gerencie interações com recursos em diferentes Google Cloud projetos e locais geográficos configurando cada instância do cliente com as configurações específicas de projeto e local.
  • Para melhorar a capacidade de descoberta e a coesão dos serviços do Vertex AI Agent Engine

A seguir