Vista geral do Vertex AI Agent Engine

O Vertex AI Agent Engine, que faz parte da plataforma Vertex AI, é um conjunto de serviços que permite aos programadores implementar, gerir e dimensionar agentes de IA em produção. O Agent Engine processa a infraestrutura para dimensionar agentes em produção, para que se possa concentrar na criação de aplicações. O Vertex AI Agent Engine oferece os seguintes serviços que pode usar individualmente ou em combinação:

  • Tempo de execução:

  • Qualidade e avaliação (pré-visualização): avalie a qualidade do agente com o serviço de avaliação de IA gen integrado e otimize os agentes com execuções de preparação do modelo Gemini.

  • Exemplo de loja (pré-visualização): armazene e obtenha dinamicamente exemplos de poucos disparos para melhorar o desempenho do agente.

  • Sessões (pré-visualização): as sessões do motor de agentes permitem-lhe armazenar interações individuais entre utilizadores e agentes, fornecendo fontes definitivas para o contexto da conversa.

  • Memory Bank (pré-visualização): o Memory Bank do Agent Engine permite-lhe armazenar e obter informações das sessões para personalizar as interações do agente.

  • Execução de código (Pré-visualização): a execução de código do motor do agente permite que o seu agente execute código num ambiente de área de testes seguro, isolado e gerido.

Vista geral conceptual do Vertex AI Agent Engine

O Vertex AI Agent Engine faz parte do Vertex AI Agent Builder, um conjunto de funcionalidades para descobrir, criar e implementar agentes de IA.

Crie e implemente no Vertex AI Agent Engine

Nota: para uma experiência de desenvolvimento e implementação simplificada baseada no IDE com o Vertex AI Agent Engine, considere o agent-starter-pack. Oferece modelos prontos a usar, uma IU incorporada para experimentação e simplifica a implementação, as operações, a avaliação, a personalização e a observabilidade.

O fluxo de trabalho para criar um agente no Vertex AI Agent Engine é o seguinte:

Passos Descrição
1. Configure o ambiente Configure o seu projeto Google e instale a versão mais recente do SDK Vertex AI para Python.
2. Desenvolva um agente Desenvolva um agente que possa ser implementado no Vertex AI Agent Engine.
3. Implemente o agente Implemente o agente no tempo de execução gerido do Vertex AI Agent Engine.
4. Use o agente Consultar o agente enviando um pedido de API.
5. Faça a gestão do agente implementado Gerir e eliminar agentes que implementou no Vertex AI Agent Engine.

Os passos são ilustrados no diagrama seguinte:

Crie e implemente um agente 

Frameworks suportados

A tabela seguinte descreve o nível de suporte que o Vertex AI Agent Engine oferece para várias frameworks de agentes:

Nível de apoio técnico Frameworks de agentes
Modelo personalizado: pode adaptar um modelo personalizado para suportar a implementação no Vertex AI Agent Engine a partir da sua framework. CrewAI, estruturas personalizadas
Integração do SDK Vertex AI: o Vertex AI Agent Engine fornece modelos geridos por framework no SDK Vertex AI e na documentação. AG2, LlamaIndex
Integração total: as funcionalidades estão integradas para funcionar na estrutura, no Vertex AI Agent Engine e no Google Cloud ecossistema mais amplo. Agent Development Kit (ADK), LangChain, LangGraph

Implemente na produção com o Agent Starter Pack

O Agent Starter Pack é uma coleção de modelos de agentes de IA generativa prontos para produção criados para o Vertex AI Agent Engine. O Agent Starter Pack oferece o seguinte:

  • Modelos de agentes pré-criados: ReAct, RAG, multiagente e outros modelos.
  • Playground interativo: teste e interaja com o seu agente.
  • Infraestrutura automatizada: usa o Terraform para uma gestão de recursos simplificada.
  • Pipelines de CI/CD: fluxos de trabalho de implementação automatizados que tiram partido do Cloud Build.
  • Observabilidade: apoio técnico integrado para o Cloud Trace e o Cloud Logging.

Para começar, consulte o Início rápido.

Exemplos de utilização

Para saber mais sobre o Vertex AI Agent Engine com exemplos completos, consulte os seguintes recursos:

Exemplo de utilização Descrição Links
Crie agentes estabelecendo ligação a APIs públicas Fazer conversões entre moedas.

Crie uma função que se ligue a uma app de câmbio de moeda, permitindo que o modelo forneça respostas precisas a consultas como "Qual é a taxa de câmbio de euros para dólares hoje?"
Notebook do SDK Vertex AI para Python: introdução à criação e implementação de um agente com o Vertex AI Agent Engine
Conceber um projeto de energia solar comunitária.

Identifique potenciais localizações, procure fornecedores e organismos governamentais relevantes e reveja imagens de satélite e o potencial solar de regiões e edifícios para encontrar a localização ideal para instalar os seus painéis solares.
Notebook do SDK Vertex AI para Python: criar e implementar um agente da API Google Maps com o Vertex AI Agent Engine
Crie agentes associando-os a bases de dados Integração com o AlloyDB e o Cloud SQL para PostgreSQL. Publicação no blogue: anúncio do LangChain no Vertex AI para o AlloyDB e o Cloud SQL para PostgreSQL

Notebook do SDK do Vertex AI para Python: implementação de uma aplicação RAG com o Cloud SQL para PostgreSQL no Vertex AI Agent Engine

Notebook do SDK do Vertex AI para Python: implementação de uma aplicação RAG com o AlloyDB para PostgreSQL no Vertex AI Agent Engine
Crie agentes com ferramentas que acedem aos dados na sua base de dados. Notebook do SDK Vertex AI para Python: implementação de um agente com o Vertex AI Agent Engine e o MCP Toolbox for Databases
Consultar e compreender arquivos de dados estruturados através de linguagem natural. Notebook do SDK Vertex AI para Python: criar um agente de pesquisa conversacional com o Vertex AI Agent Engine e a RAG na Vertex AI Search
Consultar e compreender bases de dados de grafos através da linguagem natural Publicação no blogue: IA gen GraphRAG e agentes de IA com o Vertex AI Agent Engine com LangChain e Neo4j
Consultar e compreender bases de dados vetoriais através da linguagem natural Publicação no blogue: simplifique a RAG de IA gen com o MongoDB Atlas e o Vertex AI Agent Engine
Crie agentes com o Agent Development Kit Crie e implemente agentes com o Agent Development Kit. Agent Development Kit – Implementação no Vertex AI Agent Engine
Faça a gestão do contexto com as sessões do Vertex AI Agent Engine e o Memory Bank no modo expresso do Vertex AI sem faturação. Agent Development Kit: sessões do Vertex AI Agent Engine e banco de memória no modo expresso do Vertex AI.
Crie agentes com frameworks de software de código aberto Crie e implemente agentes com a framework de código aberto OneTwo. Publicação no blogue - OneTwo e Vertex AI Agent Engine: explorar o desenvolvimento avançado de agentes de IA na Google Cloud
Crie e implemente agentes com a framework de código aberto LangGraph. Notebook do SDK Vertex AI para Python: criar e implementar uma aplicação LangGraph com o Vertex AI Agent Engine
Depurar e otimizar agentes Crie e rastreie agentes com o OpenTelemetry e o Cloud Trace. Vertex AI SDK for Python notebook - Debugging and Optimizing Agents: A Guide to Tracing in Vertex AI Agent Engine
Crie sistemas multiagentes com o protocolo A2A (pré-visualização) Crie agentes interoperáveis que comunicam e colaboram com outros agentes, independentemente da respetiva estrutura. Para mais informações, consulte a documentação do protocolo A2A.

Segurança empresarial

O Vertex AI Agent Engine suporta várias funcionalidades para ajudar a cumprir os requisitos de segurança empresariais, a seguir as políticas de segurança da sua organização e a seguir as práticas recomendadas de segurança. As seguintes funcionalidades são suportadas:

  • VPC Service Controls: o Vertex AI Agent Engine suporta os VPC Service Controls para reforçar a segurança dos dados e mitigar os riscos de exfiltração de dados. Quando os VPC Service Controls estão configurados, o agente implementado mantém o acesso seguro às APIs e aos serviços Google, como a API BigQuery, a API Cloud SQL Admin e a API Vertex AI, validando o funcionamento perfeito no seu perímetro definido. De forma crítica, os controlos de serviços da VPC bloqueiam eficazmente todo o acesso público à Internet, limitando o movimento de dados aos limites da sua rede autorizada e melhorando significativamente a sua postura de segurança empresarial.

  • Interface do Private Service Connect: para o Vertex AI Agent Engine Runtime, o PSC-I permite que os seus agentes interajam com serviços alojados de forma privada na VPC de um utilizador. Para mais informações, consulte o artigo Usar a interface do Private Service Connect com o Vertex AI Agent Engine.

  • Chaves de encriptação geridas pelo cliente (CMEK): o Vertex AI Agent Engine suporta CMEK para proteger os seus dados com as suas próprias chaves de encriptação, o que lhe dá a propriedade e o controlo total das chaves que protegem os seus dados em repouso no Google Cloud. Para mais informações, consulte o artigo CMEK do Agent Engine.

  • Residência de dados (DRZ): o Vertex AI Agent Engine suporta a residência de dados (DRZ) para garantir que todos os dados em repouso e em utilização são armazenados na região especificada.

  • HIPAA: como parte da plataforma Vertex AI, o Vertex AI Agent Engine suporta cargas de trabalho da HIPAA.

  • Transparência de acesso: a Transparência de acesso fornece-lhe registos que captam as ações que o pessoal da Google realiza quando acede ao seu conteúdo. Para mais informações sobre como ativar a Transparência de acesso para o Vertex AI Agent Engine, consulte o artigo Transparência de acesso na Vertex AI.

A tabela seguinte mostra que funcionalidades de segurança empresarial são suportadas para cada serviço do Agent Engine:

Funcionalidade de segurança Tempo de execução Sessões Banco de memória Exemplo de loja Execução de código
VPC Service Controls Sim Sim Sim Não Não
Chaves de encriptação geridas do cliente Sim Sim Sim Não Não
Residência dos dados (DRZ) em repouso Sim Sim Sim Não Não
Residência de dados (DRZ) em utilização Não Sim Sim* Não Sim
HIPAA Sim Sim Sim Sim Não
Transparência de acesso Sim Sim Sim Não Não

* Apenas quando usa um ponto final regional do Gemini.

Regiões suportadas

O tempo de execução do Vertex AI Agent Engine, as sessões do Agent Engine e o banco de memória do Vertex AI Agent Engine são suportados nas seguintes regiões:

Região Localização Versões suportadas
us-central1 Iowa v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
us-east4 Virgínia do Norte v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
us-west1 Oregon v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-west1 Bélgica v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-west2 Londres v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-west3 Frankfurt v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-west4 Países Baixos v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
europe-southwest1 Madrid v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
asia-east1 Taiwan v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
asia-northeast1 Tóquio v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
asia-south1 Mumbai v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
asia-southeast1 Singapura v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.
australia-southeast2 Melbourne v1 é suportado para funcionalidades da DG. O v1beta1 é suportado para funcionalidades de pré-visualização.

Para a execução de código do motor do agente (pré-visualização), as seguintes regiões são suportadas.

Região Localização Versões suportadas
us-central1 Iowa A versão v1beta1 é suportada.

Quota

Os seguintes limites aplicam-se ao Vertex AI Agent Engine para um determinado projeto em cada região:
Descrição Limite
Criar, eliminar ou atualizar o Vertex AI Agent Engine por minuto 10
Criar, eliminar ou atualizar sessões do Vertex AI Agent Engine por minuto 100
Query ou StreamQuery Vertex AI Agent Engine por minuto 90
Anexar evento a sessões do Vertex AI Agent Engine por minuto 300
Número máximo de recursos do Vertex AI Agent Engine 100
Criar, eliminar ou atualizar recursos de memória do Vertex AI Agent Engine por minuto 100
Obtenha, liste ou recupere do banco de memória do Vertex AI Agent Engine por minuto 300
Ambiente de sandbox (execução de código) executa pedidos por minuto 1000
Entidades do ambiente de sandbox (execução de código) por região 1000
Um agente A2A publica pedidos como sendMessage e cancelTask por minuto 60
O agente A2A recebe pedidos como getTask e getCard por minuto 600
Ligações bidirecionais em direto simultâneas com a API BidiStreamQuery por minuto 10

Preços

Para informações sobre os preços do Agent Engine Runtime, consulte os preços do Vertex AI.

Migração para o SDK client-based

O módulo agent_engines no SDK Vertex AI para Python está a ser refatorado para um design baseado no cliente pelos seguintes motivos principais:

  • Para se alinhar com o ADK da Google e o SDK de IA gen da Google em representações de tipos canónicos. Isto garante uma forma consistente e padronizada de representar os tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz os custos gerais de conversão.
  • Para o âmbito ao nível do cliente de Google Cloud parâmetros em aplicações com vários projetos e várias localizações. Isto permite que uma aplicação faça a gestão das interações com recursos em diferentes Google Cloud projetos e localizações geográficas configurando cada instância do cliente com as respetivas definições de projeto e localização.
  • Para melhorar a capacidade de deteção e a coesão dos serviços do Vertex AI Agent Engine

O que se segue?