Agent Runtime

O Agent Runtime é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e escalonar agentes de IA em produção. O Agent Runtime cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Agent Runtime oferece os seguintes serviços que podem ser usados individualmente ou em combinação:

  • Ambiente de execução:
    • Implante e escalone agentes com um ambiente de execução gerenciado e recursos de gerenciamento completos.
    • Personalize a imagem de contêiner do agente com scripts de instalação no momento da criação para dependências do sistema.
    • Use recursos de segurança, incluindo o compliance com o VPC-SC, configuração de autenticação e o IAM.
    • Acesse modelos e ferramentas com chamadas de função.
    • Implante agentes criados usando diferentes frameworks do Python e o protocolo aberto Agent2Agent.
  • Qualidade e avaliação (visualização): avalie a qualidade do agente com o serviço de avaliação de IA generativa integrado e otimize os agentes com execuções treinamento de modelo do Gemini.
  • Sessões da plataforma de agentes: permitem armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.
  • Memory Bank da plataforma de agentes: Tempo de execução do agente O Memory Bank da plataforma de agentes permite armazenar e recuperar informações de sessões para personalizar interações de agentes.
  • Execução de código: permite que o agente execute código em um ambiente de sandbox seguro, isolado, e gerenciado.
  • Exemplo de repositório (visualização): armazene e recupere dinamicamente exemplos de few-shot para melhorar o desempenho do agente.
  • Observabilidade: entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), Cloud Monitoring e Cloud Logging.
  • Governança: o Agent Runtime oferece suporte a vários recursos para ajudar você a governar agentes em produção e atender às necessidades de segurança e empresariais:
    • Detectar ameaças com o Security Command Center: a detecção de ameaças do Agent Runtime (visualização) é um serviço integrado do Security Command Center que ajuda a detectar e investigar possíveis ataques a agentes implantados no Agent Runtime.
    • Identidade do agente (visualização): use a identidade do agente do Identity Access Management (IAM) para fornecer recursos de segurança e gerenciamento de acesso ao usar agentes no Agent Runtime.
    • Gateway de agentes (visualização): use o gateway de agentes para definir regras para comunicações de agentes e aplicar políticas de segurança e controle de acesso em agentes, clientes e ferramentas que se conectam ao seu projeto. Google Cloud

Criar e implantar no Agent Runtime

O fluxo de trabalho para criar um agente no Agent Runtime é:

  1. Configurar o ambiente: configure seu projeto do Google e instale a versão mais recente do SDK da plataforma de agentes para Python.
  2. **Desenvolver um agente**: Desenvolver um agente que possa ser implantado no Agent Runtime.
  3. Implantar o agente: Implante o agente no ambiente de execução gerenciado do Agent Runtime.
  4. Usar o agente: consulte o agente enviando uma solicitação de API.
  5. Gerenciar o agente implantado: gerencie e exclua os agentes que você implantou no Agent Runtime.

As etapas estão ilustradas no diagrama a seguir:

Criar e implantar um agente 

Frameworks compatíveis

A tabela a seguir descreve o nível de suporte que o Agent Runtime oferece para vários frameworks de agentes:

Nível de suporte Frameworks de agentes
Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte a implantação no Agent Runtime do seu framework. CrewAI, frameworks personalizados
Integração do SDK da plataforma de agentes: o Agent Runtime fornece modelos gerenciados por framework no SDK da plataforma de agentes e na documentação. AG2, LlamaIndex
Integração completa: os recursos são integrados para funcionar em todo o framework, o Agent Runtime e o ecossistema mais amplo Google Cloud . Kit de Desenvolvimento de Agente (ADK), LangChain, LangGraph

Implantar na produção com a CLI Agents

A CLI Agents é a interface de linha de comando unificada e o conjunto de habilidades da plataforma de agentes do Gemini Enterprise. Ela oferece aos agentes de programação e desenvolvedores um caminho previsível pelo ciclo de vida de desenvolvimento de agentes: scaffold, avaliar, implantar, publicar e observar. A CLI Agents oferece o seguinte:

  • Modelos de agentes pré-criados:ReAct, RAG, multiagente e outros modelos.
  • Playground interativo: teste e interaja com seu agente.
  • Infraestrutura automatizada: usa o Terraform para gerenciamento de recursos simplificado.
  • Pipelines de CI/CD: fluxos de trabalho de implantação automatizados que aproveitam o Cloud Build.
  • Observabilidade: suporte integrado para Cloud Trace e Cloud Logging.

Para começar, consulte o Guia de início rápido.

Casos de uso

Para saber mais sobre o Agent Runtime com exemplos completos, consulte os seguintes recursos:

Clique para expandir os casos de uso

Caso de uso Descrição Links
Criar agentes conectando-se a APIs públicas Converta entre moedas.

Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?"
Notebook do SDK da plataforma de agentes (Python): introdução à criação e implantação de um agente com o Agent Runtime
Projetando um projeto de energia solar comunitária.

Identifique locais potenciais procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares.
Notebook do SDK da plataforma de agentes (Python): como criar e implantar um agente da API Google Maps com o Agent Runtime
Criar agentes conectando-se a bancos de dados Integração com o AlloyDB e o Cloud SQL para PostgreSQL. Postagem do blog: anúncio do LangChain na plataforma de agentes do Gemini Enterprise para AlloyDB e Cloud SQL para PostgreSQL

Notebook do SDK da plataforma de agentes (Python): implantação de um aplicativo RAG com o Cloud SQL para PostgreSQL no Agent Runtime

Notebook do SDK da plataforma de agentes (Python): implantação de um aplicativo RAG com o AlloyDB para PostgreSQL no Agent Runtime
Criar agentes com ferramentas que acessam dados no seu banco de dados. Notebook do SDK da plataforma de agentes (Python): implantação de um agente com o Agent Runtime e o MCP Toolbox para bancos de dados
Consultar e entender repositórios de dados estruturados usando linguagem natural. Notebook do SDK da plataforma de agentes (Python): como criar um agente de pesquisa de conversação com o Agent Runtime e a RAG na pesquisa de agentes
Consulte e entenda bancos de dados de gráficos usando linguagem natural Postagem do blog: GenAI GraphRAG e agentes de IA usando o Agent Runtime com o LangChain e o Neo4j
Consultar e entender repositórios de vetores usando linguagem natural Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Agent Runtime
Criar agentes com o Kit de Desenvolvimento de Agente Crie e implante agentes usando o Kit de Desenvolvimento de Agente. Kit de Desenvolvimento de Agente: implantação no Agent Runtime
Criar agentes com frameworks de OSS Crie e implante agentes usando o framework de código aberto OneTwo. Postagem do blog: OneTwo e Agent Runtime: explorando o desenvolvimento avançado de agentes de IA no Google Cloud
Crie e implante agentes usando o framework de código aberto LangGraph. Notebook do SDK da plataforma de agentes (Python): criar e implantar um aplicativo LangGraph com o Agent Runtime
Depuração e otimização de agentes Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace. Notebook do SDK da plataforma de agentes (Python): depuração e otimização de agentes: um guia de rastreamento no Agent Runtime
Criar sistemas multiagentes com o protocolo A2A (visualização) Crie agentes interoperáveis que se comunicam e colaboram com outros agentes, independentemente do framework. Para mais informações, consulte a documentação do protocolo A2A.

Segurança corporativa

O Agent Runtime oferece suporte a vários recursos para ajudar você a atender aos requisitos de segurança corporativa, aderir às políticas de segurança da sua organização e seguir as práticas recomendadas de segurança. Os seguintes recursos são compatíveis:

  • VPC Service Controls: o Agent Runtime oferece suporte ao VPC Service Controls para fortalecer a segurança de dados e reduzir os riscos de exfiltração de dados. Para mais informações, consulte VPC Service Controls do Agent Runtime.

  • Interface do Private Service Connect: para o Agent Runtime, o PSC-I permite que seus agentes interajam com serviços hospedados de maneira particular na VPC de um usuário. Para mais informações, consulte Como usar a interface do Private Service Connect com o Agent Runtime.

  • Chaves de criptografia gerenciadas pelo cliente (CMEK): o Agent Runtime oferece suporte a CMEK para proteger seus dados com suas próprias chaves de criptografia, o que oferece propriedade e controle total das chaves que protegem seus dados em repouso no Google Cloud. Para mais informações, consulte CMEK do Agent Runtime.

  • Residência de dados (DRZ): o Agent Runtime oferece suporte à residência de dados (DRZ) para garantir que todos os dados em repouso sejam armazenados na região especificada.

  • HIPAA: como parte da plataforma de agentes, o Agent Runtime oferece suporte a cargas de trabalho HIPAA.

  • Transparência no acesso: a transparência no acesso fornece registros que capturam as ações executadas pela equipe do Google ao acessar seu conteúdo. Para mais informações sobre como ativar a transparência no acesso para o Agent Runtime, consulte Transparência no acesso na plataforma de agentes.

A tabela a seguir mostra quais recursos de segurança corporativa são compatíveis com cada serviço da plataforma de agentes:

Recurso de segurança Agent Runtime Sessões Memory Bank Exemplo de repositório execução de código
VPC Service Controls Sim Sim Sim Não Sim
Chaves de criptografia gerenciadas pelo cliente Sim Sim Sim Não Sim
Residência de dados (DRZ) em repouso Sim Sim Sim Não Sim
HIPAA Sim Sim Sim Sim Sim
Transparência no acesso Sim Sim Sim Não Não
Aprovação de acesso Sim Sim Sim Não Não

Regiões compatíveis

Consulte Locais para conferir uma lista de regiões compatíveis com o Agent Runtime.

Quota

Consulte Cotas e limites do sistema para informações sobre a cota do Agent Runtime.

Preços

Um nível sem custo financeiro está disponível para o Agent Runtime. Para informações sobre preços do Agent Runtime, consulte Preços da plataforma de agentes do Gemini Enterprise preços.

Migração para o SDK baseado no cliente

O módulo agent_engines no SDK da plataforma de agentes está sendo refatorado para um design baseado no cliente pelos seguintes motivos principais:

  • Para se alinhar ao Kit de Desenvolvimento de Agente (ADK) e ao SDK de IA Generativa do Google em representações de tipo canônico. Isso garante uma maneira consistente e padronizada de representar tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz a sobrecarga de conversão.
  • Para o escopo de Google Cloud parâmetros no nível do cliente em aplicativos multirregionais de vários projetos. Isso permite que um aplicativo gerencie interações com recursos em diferentes Google Cloud projetos e locais geográficos configurando cada instância do cliente com as configurações específicas de projeto e local.
  • Para melhorar a capacidade de descoberta e a coesão dos serviços do Agent Runtime

A seguir

Guia

Configure seu ambiente para usar o ambiente de execução da plataforma de agentes.

Recurso

Receba suporte para o desenvolvimento da plataforma de agentes.