Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Agent Runtime

O Agent Runtime é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e escalonar agentes de IA em produção. O Agent Runtime cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Agent Runtime oferece os seguintes serviços que podem ser usados individualmente ou em combinação:

Tempo de execução:
- Implante e escalone agentes com um ambiente de execução gerenciado e recursos de gerenciamento completos.
- Personalize a imagem do contêiner do agente com scripts de instalação no momento da build para dependências do sistema.
- Use recursos de segurança, incluindo o compliance com o VPC-SC, configuração de autenticação e o IAM.
- Acesse modelos e ferramentas como chamada de função.
- Implante agentes criados usando diferentes frameworks do Python e o protocolo aberto Agent2Agent.
Qualidade e avaliação (prévia): avalie a qualidade do agente com o serviço de avaliação de IA generativa integrado e otimize os agentes com execuções treinamento de modelo Gemini.
Sessões da Plataforma de Agentes: permitem armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.
Memory Bank da Plataforma de Agentes: tempo de execução do agente Com o Memory Bank da Plataforma de Agentes, você armazena e recupera informações de sessões para personalizar as interações do agente.
Execução de código: a execução de código do ambiente de execução do agente permite que ele execute código em um ambiente de sandbox seguro, isolado e gerenciado.
Example Store (prévia): armazene e recupere dinamicamente exemplos de few-shot para melhorar a performance do agente.
Observabilidade: entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), o Cloud Monitoring e o Cloud Logging.
Governança: o ambiente de execução do agente oferece suporte a vários recursos para ajudar você a governar agentes em produção e atender às suas necessidades de segurança e empresariais:
- Detectar ameaças com o Security Command Center: a detecção de ameaças de tempo de execução do agente (prévia) é um serviço integrado do Security Command Center que ajuda a detectar e investigar possíveis ataques a agentes implantados no tempo de execução do agente.
- Identidade do agente (prévia): use a identidade do agente do Identity Access Management (IAM) para fornecer recursos de segurança e gerenciamento de acesso ao usar agentes no Agent Runtime.
- Agent Gateway (prévia): use o Agent Gateway para definir regras de comunicações de agentes e aplicar políticas de segurança e controle de acesso em agentes, clientes e ferramentas que se conectam ao seu projetoGoogle Cloud .

Criar e implantar no Agent Runtime

O fluxo de trabalho para criar um agente no Agent Runtime é:

Configure o ambiente: configure seu projeto do Google e instale a versão mais recente do SDK da Agent Platform para Python.
Desenvolver um agente: desenvolva um agente que possa ser implantado no Agent Runtime.
Implante o agente: implante o agente no ambiente de execução gerenciado do Agent Runtime.
Usar o agente: consulte o agente enviando uma solicitação de API.
Gerenciar o agente implantado: gerencie e exclua agentes implantados no Agent Runtime.

As etapas estão ilustradas no diagrama a seguir:

Criar e implantar um agente

Frameworks compatíveis

A tabela a seguir descreve o nível de suporte que o ambiente de execução do agente oferece para várias estruturas de agente:

Nível de suporte	Frameworks de agentes
Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no ambiente de execução do agente pelo seu framework.	CrewAI, estruturas personalizadas
Integração do SDK da Agent Platform: o Agent Runtime fornece modelos gerenciados por framework no SDK e na documentação da Agent Platform.	AG2, LlamaIndex
Integração completa: os recursos são integrados para funcionar em todo o framework, o Agent Runtime e o ecossistema Google Cloud mais amplo.	Kit de desenvolvimento de agentes (ADK), LangChain, LangGraph

Implantar em produção com a CLI Agents

A CLI de agentes é a interface de linha de comando e o conjunto de habilidades unificados para a Gemini Enterprise Agent Platform. Ele oferece aos agentes e desenvolvedores de programação um caminho previsível pelo ciclo de vida de desenvolvimento de agentes: estruturar, avaliar, implantar, publicar e observar. A CLI de agentes oferece o seguinte:

Modelos de agentes pré-criados:ReAct, RAG, multiagente e outros modelos.
Playground interativo: teste e interaja com seu agente.
Infraestrutura automatizada: usa o Terraform para simplificar o gerenciamento de recursos.
Pipelines de CI/CD: fluxos de trabalho de implantação automatizados que usam o Cloud Build.
Observabilidade: suporte integrado para o Cloud Trace e o Cloud Logging.

Para começar, consulte o Guia de início rápido.

Casos de uso

Para saber mais sobre o Agent Runtime com exemplos completos, consulte os seguintes recursos:

Clique para abrir os casos de uso

Caso de uso	Descrição	Links
Criar agentes conectando-se a APIs públicas	Converta entre moedas. Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?"	Notebook do SDK da Agent Platform (Python): introdução à criação e implantação de um agente com o Agent Runtime
Criar agentes conectando-se a APIs públicas	Projetando um projeto solar comunitário. Identifique locais potenciais, procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares.	Notebook do Agent Platform SDK (Python): como criar e implantar um agente da API Google Maps com o Agent Runtime
Criar agentes conectando-se a bancos de dados	Integração com o AlloyDB e o Cloud SQL para PostgreSQL.	Postagem do blog: anúncio da LangChain na Gemini Enterprise Agent Platform para AlloyDB e Cloud SQL para PostgreSQL Notebook do SDK da Agent Platform (Python): como implantar um aplicativo RAG com o Cloud SQL para PostgreSQL no tempo de execução do agente Notebook do SDK da Agent Platform (Python): como implantar um aplicativo RAG com o AlloyDB para PostgreSQL no tempo de execução do agente
	Crie agentes com ferramentas que acessam dados no seu banco de dados.	Notebook do SDK da Agent Platform (Python): como implantar um agente com o Agent Runtime e o MCP Toolbox for Databases
	Consultar e entender repositórios de dados estruturados usando linguagem natural.	Notebook do SDK da Agent Platform (Python): como criar um agente de pesquisa de conversação com o Agent Runtime e a RAG na Pesquisa de agentes
	Consulte e entenda bancos de dados de gráficos usando linguagem natural	Postagem do blog: GenAI GraphRAG e agentes de IA usando o ambiente de execução do agente com o LangChain e o Neo4j
	Consultar e entender repositórios de vetores usando linguagem natural	Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Agent Runtime
Criar agentes com o Kit de Desenvolvimento de Agente	Crie e implante agentes usando o Kit de Desenvolvimento de Agente.	Kit de Desenvolvimento de Agente: implantação no Agent Runtime
	Criar agentes com frameworks de OSS	Crie e implante agentes usando o framework de código aberto OneTwo.	Postagem do blog: OneTwo e Agent Runtime: explorando o desenvolvimento avançado de agentes de IA no Google Cloud
	Criar agentes com frameworks de OSS	Crie e implante agentes usando o framework de código aberto LangGraph.	Notebook do SDK da Agent Platform (Python): como criar e implantar um aplicativo LangGraph com o Agent Runtime
Depuração e otimização de agentes	Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace.	Notebook do SDK da Agent Platform (Python): depuração e otimização de agentes: um guia de rastreamento no Agent Runtime
Criar sistemas multiagente com o protocolo A2A (prévia)	Crie agentes interoperáveis que se comuniquem e colaborem com outros agentes, independente da estrutura deles.	Para mais informações, consulte a documentação do protocolo A2A.

Segurança empresarial

O Agent Runtime oferece suporte a vários recursos para ajudar você a atender aos requisitos de segurança empresarial, aderir às políticas de segurança da sua organização e seguir as práticas recomendadas de segurança. Os seguintes recursos são compatíveis:

VPC Service Controls: o Agent Runtime é compatível com o VPC Service Controls para reforçar a segurança de dados e reduzir os riscos de exfiltração de dados. Para mais informações, consulte VPC Service Controls do tempo de execução do agente.
Interface do Private Service Connect: para o tempo de execução do agente, o PSC-I permite que seus agentes interajam com serviços hospedados de maneira privada na VPC de um usuário. Para mais informações, consulte Como usar a interface do Private Service Connect com o Agent Runtime.
Chaves de criptografia gerenciadas pelo cliente (CMEK): o tempo de execução do agente é compatível com CMEK para proteger seus dados com suas próprias chaves de criptografia, o que dá a você a propriedade e o controle total das chaves que protegem seus dados em repouso no Google Cloud. Para mais informações, consulte CMEK do ambiente de execução do agente.
Residência de dados (DRZ): o tempo de execução do agente é compatível com a residência de dados (DRZ) para garantir que todos os dados em repouso sejam armazenados na região especificada.
HIPAA: como parte da Agent Platform, o Agent Runtime oferece suporte a cargas de trabalho da HIPAA.
Transparência no acesso: a Transparência no acesso fornece registros que capturam as ações realizadas pela equipe do Google ao acessar seu conteúdo. Para mais informações sobre como ativar a Transparência no acesso para o tempo de execução do agente, consulte Agent Platform.

A tabela a seguir mostra quais recursos de segurança empresarial são compatíveis com cada serviço da Agent Platform:

Recurso de segurança	Agent Runtime	Sessões	Memory Bank	Exemplo de repositório	execução de código
VPC Service Controls	Sim	Sim	Sim	Não	Sim
Chaves de criptografia gerenciadas pelo cliente	Sim	Sim	Sim	Não	Sim
Residência de dados (DRZ) em repouso	Sim	Sim	Sim	Não	Sim
HIPAA	Sim	Sim	Sim	Sim	Sim
Transparência no acesso	Sim	Sim	Sim	Não	Não
Aprovação de acesso	Sim	Sim	Sim	Não	Não

Regiões compatíveis

Consulte Locais para conferir uma lista de regiões compatíveis com o tempo de execução do agente.

Cota

Consulte Cotas e limites do sistema para informações sobre cotas do tempo de execução do agente.

Preços

Um nível sem custo financeiro está disponível para o Agent Runtime. Para informações sobre preços do Agent Runtime, consulte os preços da Gemini Enterprise Agent Platform.

Migração para o SDK baseado em cliente

O módulo agent_engines no SDK da Agent Platform está sendo refatorado para um design baseado em cliente pelos seguintes motivos principais:

Para se alinhar ao Kit de Desenvolvimento de Agente (ADK) e ao SDK de IA generativa do Google em representações de tipo canônico. Isso garante uma maneira consistente e padronizada de representar tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz o overhead de conversão.
Para escopo no nível do cliente de parâmetros Google Cloud em aplicativos de vários projetos e locais. Isso permite que um aplicativo gerencie interações com recursos em diferentes projetos do Google Cloud e locais geográficos configurando cada instância do cliente com as configurações específicas de projeto e local.
Para melhorar a capacidade de descoberta e a coesão dos serviços do Agent Runtime

A seguir

Guia

Configuração do Agent Platform runtime

Configure seu ambiente para usar o Agent Platform Runtime.

Recurso

Receber suporte

Receba suporte para o desenvolvimento da Agent Platform.