Agent Runtime

O Agent Runtime é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e escalonar agentes de IA em produção. O Agent Runtime cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O ambiente de execução do agente oferece os seguintes serviços que podem ser usados individualmente ou em combinação:

  • Tempo de execução:
    • Implante e escalone agentes com um ambiente de execução gerenciado e recursos de gerenciamento completos.
    • Personalize a imagem do contêiner do agente com scripts de instalação no momento da build para dependências do sistema.
    • Use recursos de segurança, incluindo o compliance com o VPC-SC, configuração de autenticação e o IAM.
    • Acesse modelos e ferramentas como chamada de função.
    • Implante agentes criados usando diferentes frameworks do Python e o protocolo aberto Agent2Agent.
  • Qualidade e avaliação (prévia): avalie a qualidade do agente com o Serviço de avaliação de IA generativa integrado e otimize os agentes com execuções de treinamento de modelo Gemini.
  • Sessões da plataforma do agente: permitem armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.
  • Memory Bank da Agent Platform: o Agent Runtime permite armazenar e recuperar informações de sessões para personalizar as interações do agente.
  • Execução de código: a execução de código do ambiente de execução do agente permite que ele execute código em um ambiente de sandbox seguro, isolado e gerenciado.
  • Example Store (prévia): armazene e recupere dinamicamente exemplos de few-shot para melhorar a performance do agente.
  • Observabilidade: entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), o Cloud Monitoring e o Cloud Logging.
  • Governança: o ambiente de execução do agente oferece suporte a vários recursos para ajudar você a governar agentes em produção e atender às suas necessidades de segurança e empresariais:
    • Detectar ameaças com o Security Command Center: a detecção de ameaças de ambiente de execução do agente (prévia) é um serviço integrado do Security Command Center que ajuda a detectar e investigar possíveis ataques a agentes implantados no ambiente de execução do agente.
    • Identidade do agente (prévia): use a identidade do agente do gerenciamento de identidade e acesso (IAM) para fornecer recursos de segurança e gerenciamento de acesso ao usar agentes no tempo de execução do agente.
    • Gateway de agente (prévia): use o Gateway de agente para definir regras de comunicações de agentes e aplicar políticas de segurança e controle de acesso em agentes, clientes e ferramentas que se conectam ao seu projetoGoogle Cloud .

Criar e implantar no Agent Runtime

O fluxo de trabalho para criar um agente no Agent Runtime é:

  1. Configure o ambiente: configure seu projeto do Google e instale a versão mais recente do SDK da plataforma de agentes para Python.
  2. Desenvolver um agente: desenvolva um agente que possa ser implantado no Agent Runtime.
  3. Implante o agente: implante o agente no ambiente de execução gerenciado do Agent Runtime.
  4. Usar o agente: consulte o agente enviando uma solicitação de API.
  5. Gerenciar o agente implantado: gerencie e exclua os agentes implantados no Agent Runtime.

As etapas estão ilustradas no diagrama a seguir:

Criar e implantar um agente 

Frameworks compatíveis

A tabela a seguir descreve o nível de suporte que o ambiente de execução do agente oferece para várias estruturas de agente:

Nível de suporte Frameworks de agentes
Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no ambiente de execução do agente usando seu framework. CrewAI, estruturas personalizadas
Integração do SDK da plataforma de agentes: o Agent Runtime fornece modelos gerenciados por framework no SDK da plataforma de agentes e na documentação. AG2, LlamaIndex
Integração completa: os recursos são integrados para funcionar em todo o framework, no ambiente de execução do agente e no ecossistema Google Cloud mais amplo. Kit de desenvolvimento de agentes (ADK), LangChain, LangGraph

Implantar em produção com a CLI Agents

A CLI de agentes é a interface de linha de comando e o conjunto de habilidades unificados para a plataforma de agentes do Gemini Enterprise. Ele oferece aos agentes e desenvolvedores de programação um caminho previsível pelo ciclo de vida de desenvolvimento de agentes: estruturar, avaliar, implantar, publicar e observar. A CLI Agents oferece o seguinte:

  • Modelos de agentes predefinidos:ReAct, RAG, multiagente e outros modelos.
  • Playground interativo: teste e interaja com seu agente.
  • Infraestrutura automatizada: usa o Terraform para gerenciamento simplificado de recursos.
  • Pipelines de CI/CD: fluxos de trabalho de implantação automatizada que usam o Cloud Build.
  • Observabilidade: suporte integrado para o Cloud Trace e o Cloud Logging.

Para começar, consulte o Guia de início rápido.

Casos de uso

Para saber mais sobre o Agent Runtime com exemplos completos, consulte os seguintes recursos:

Clique para abrir os casos de uso

Caso de uso Descrição Links
Crie agentes conectando-se a APIs públicas Converta entre moedas.

Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?"
Notebook do SDK da plataforma de agentes (Python): introdução à criação e implantação de um agente com o Agent Runtime
Projetando um projeto solar comunitário.

Identifique locais potenciais, procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares.
Notebook do SDK da plataforma de agentes (Python): como criar e implantar um agente da API Google Maps com o tempo de execução do agente
Crie agentes conectando-se a bancos de dados Integração com o AlloyDB e o Cloud SQL para PostgreSQL. Postagem do blog: anúncio da LangChain na plataforma de agentes do Gemini Enterprise para AlloyDB e Cloud SQL para PostgreSQL

Notebook do SDK da plataforma de agentes (Python): como implantar um aplicativo RAG com o Cloud SQL para PostgreSQL no tempo de execução do agente

Notebook do SDK da plataforma de agentes (Python): como implantar um aplicativo RAG com o AlloyDB para PostgreSQL no tempo de execução do agente
Crie agentes com ferramentas que acessam dados no seu banco de dados. Notebook do SDK da plataforma de agentes (Python): implantação de um agente com o Agent Runtime e o MCP Toolbox for Databases
Consultar e entender repositórios de dados estruturados usando linguagem natural. Notebook do SDK da plataforma de agentes (Python): como criar um agente de pesquisa de conversação com o tempo de execução do agente e a RAG na pesquisa de agentes
Consulte e entenda bancos de dados de gráficos usando linguagem natural Postagem do blog: GenAI GraphRAG e agentes de IA usando o ambiente de execução do agente com o LangChain e o Neo4j
Consultar e entender repositórios de vetores usando linguagem natural Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Agent Runtime
Criar agentes com o Kit de Desenvolvimento de Agente Criar e implantar agentes usando o Kit de Desenvolvimento de Agente. Kit de Desenvolvimento de Agente: implantação no ambiente de execução do agente
Criar agentes com frameworks de OSS Crie e implante agentes usando o framework de código aberto OneTwo. Postagem do blog: OneTwo e ambiente de execução do agente: explorando o desenvolvimento avançado de agentes de IA no Google Cloud
Crie e implante agentes usando o framework de código aberto LangGraph. Notebook do SDK da plataforma de agentes (Python): criar e implantar um aplicativo LangGraph com o tempo de execução do agente
Depuração e otimização de agentes Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace. Notebook do SDK da plataforma de agentes (Python): depuração e otimização de agentes: um guia de rastreamento no tempo de execução do agente
Criar sistemas multiagente com o protocolo A2A (prévia) Crie agentes interoperáveis que se comunicam e colaboram com outros agentes, independente da estrutura deles. Para mais informações, consulte a documentação do protocolo A2A.

Segurança corporativa

O Agent Runtime oferece suporte a vários recursos para ajudar você a atender aos requisitos de segurança empresarial, aderir às políticas de segurança da sua organização e seguir as práticas recomendadas de segurança. Há suporte para os seguintes recursos:

  • VPC Service Controls: o Agent Runtime é compatível com o VPC Service Controls para reforçar a segurança de dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls está configurado, o agente implantado mantém o acesso seguro a APIs e serviços do Google, como API BigQuery, API Cloud SQL Admin e API Agent Platform, verificando a operação perfeita dentro do perímetro definido. O VPC Service Controls bloqueia todo o acesso público à Internet, confinando a movimentação de dados aos limites da rede autorizada e melhorando significativamente a postura de segurança da empresa.

    O VPC Service Controls não é compatível com o Agent Gateway. No entanto, é possível usar restrições personalizadas da política da organização para restringir quais gateways podem ser associados aos seus agentes. Para mais informações, consulte Encaminhar o tráfego pela Agent Gateway.

  • Interface do Private Service Connect: para o tempo de execução do agente, o PSC-I permite que seus agentes interajam com serviços hospedados de maneira privada na VPC de um usuário. Para mais informações, consulte Como usar a interface do Private Service Connect com o Agent Runtime.

  • Chaves de criptografia gerenciadas pelo cliente (CMEK): o tempo de execução do agente é compatível com CMEK para proteger seus dados com suas próprias chaves de criptografia, o que dá a você a propriedade e o controle total das chaves que protegem seus dados em repouso no Google Cloud. Para mais informações, consulte CMEK do ambiente de execução do agente.

  • Residência de dados (DRZ): o tempo de execução do agente é compatível com a residência de dados (DRZ) para garantir que todos os dados em repouso sejam armazenados na região especificada.

  • HIPAA: como parte da Agent Platform, o Agent Runtime oferece suporte a cargas de trabalho da HIPAA.

  • Transparência no acesso: a Transparência no acesso fornece registros que capturam as ações realizadas pela equipe do Google ao acessar seu conteúdo. Para mais informações sobre como ativar a Transparência no acesso para o Agent Runtime, consulte Transparência no acesso na plataforma de agentes.

A tabela a seguir mostra quais recursos de segurança empresarial são compatíveis com cada serviço da plataforma do agente:

Recurso de segurança Agent Runtime Sessões Banco de memória Exemplo de repositório execução de código
VPC Service Controls Sim Sim Sim Não Sim
Chaves de criptografia gerenciadas pelo cliente Sim Sim Sim Não Sim
Residência dos dados (DRZ) em repouso Sim Sim Sim Não Sim
HIPAA Sim Sim Sim Sim Sim
Transparência no acesso Sim Sim Sim Não Não
Aprovação de acesso Sim Sim Sim Não Não

Regiões compatíveis

Consulte Locais para ver uma lista de regiões compatíveis com o tempo de execução do agente.

Cota

Consulte Cotas e limites do sistema para informações sobre cotas do tempo de execução do agente.

Preços

Um nível sem custo financeiro está disponível para o Agent Runtime. Para informações sobre preços do Agent Runtime, consulte os preços da plataforma de agentes do Gemini Enterprise.

Migração para o SDK baseado em cliente

O módulo agent_engines no SDK da Plataforma de Agentes está sendo refatorado para um design baseado em cliente pelos seguintes motivos principais:

  • Para se alinhar ao Kit de Desenvolvimento de Agente (ADK) e ao SDK de IA generativa do Google em representações de tipo canônico. Isso garante uma maneira consistente e padronizada de representar tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz o overhead de conversão.
  • Para escopo no nível do cliente de parâmetros Google Cloud em aplicativos de vários projetos e locais. Isso permite que um aplicativo gerencie interações com recursos em diferentes Google Cloud projetos e localizações geográficas configurando cada instância do cliente com as configurações específicas de projeto e localização.
  • Para melhorar a capacidade de descoberta e a coesão dos serviços do Agent Runtime.

A seguir

Guia

Configure o ambiente para usar o ambiente de execução da plataforma de agentes.

Recurso

Receba suporte para o desenvolvimento da Agent Platform.