O Agent Runtime é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e escalonar agentes de IA em produção. O Agent Runtime cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Agent Runtime oferece os seguintes serviços que podem ser usados individualmente ou em combinação:
- Tempo de execução:
- Implante e escalone agentes com um ambiente de execução gerenciado e recursos de gerenciamento completos.
- Personalize a imagem do contêiner do agente com scripts de instalação no momento da build para dependências do sistema.
- Use recursos de segurança, incluindo o compliance com o VPC-SC, configuração de autenticação e o IAM.
- Acesse modelos e ferramentas como chamada de função.
- Implante agentes criados usando diferentes frameworks do Python e o protocolo aberto Agent2Agent.
- Qualidade e avaliação (prévia): avalie a qualidade do agente com o serviço de avaliação de IA generativa integrado e otimize os agentes com execuções treinamento de modelo Gemini.
- Sessões da Plataforma de Agentes: permitem armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.
- Memory Bank da Plataforma de Agentes: tempo de execução do agente Com o Memory Bank da Plataforma de Agentes, você armazena e recupera informações de sessões para personalizar as interações do agente.
- Execução de código: a execução de código do ambiente de execução do agente permite que ele execute código em um ambiente de sandbox seguro, isolado e gerenciado.
- Example Store (prévia): armazene e recupere dinamicamente exemplos de few-shot para melhorar a performance do agente.
- Observabilidade: entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), o Cloud Monitoring e o Cloud Logging.
- Governança: o ambiente de execução do agente oferece suporte a vários recursos para ajudar você a governar agentes em produção e atender às suas necessidades de segurança e empresariais:
- Detectar ameaças com o Security Command Center: a detecção de ameaças de tempo de execução do agente (prévia) é um serviço integrado do Security Command Center que ajuda a detectar e investigar possíveis ataques a agentes implantados no tempo de execução do agente.
- Identidade do agente (prévia): use a identidade do agente do Identity Access Management (IAM) para fornecer recursos de segurança e gerenciamento de acesso ao usar agentes no Agent Runtime.
- Agent Gateway (prévia): use o Agent Gateway para definir regras de comunicações de agentes e aplicar políticas de segurança e controle de acesso em agentes, clientes e ferramentas que se conectam ao seu projetoGoogle Cloud .
Criar e implantar no Agent Runtime
O fluxo de trabalho para criar um agente no Agent Runtime é:
- Configure o ambiente: configure seu projeto do Google e instale a versão mais recente do SDK da Agent Platform para Python.
- Desenvolver um agente: desenvolva um agente que possa ser implantado no Agent Runtime.
- Implante o agente: implante o agente no ambiente de execução gerenciado do Agent Runtime.
- Usar o agente: consulte o agente enviando uma solicitação de API.
- Gerenciar o agente implantado: gerencie e exclua agentes implantados no Agent Runtime.
As etapas estão ilustradas no diagrama a seguir:
Frameworks compatíveis
A tabela a seguir descreve o nível de suporte que o ambiente de execução do agente oferece para várias estruturas de agente:
| Nível de suporte | Frameworks de agentes |
|---|---|
| Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no ambiente de execução do agente pelo seu framework. | CrewAI, estruturas personalizadas |
| Integração do SDK da Agent Platform: o Agent Runtime fornece modelos gerenciados por framework no SDK e na documentação da Agent Platform. | AG2, LlamaIndex |
| Integração completa: os recursos são integrados para funcionar em todo o framework, o Agent Runtime e o ecossistema Google Cloud mais amplo. | Kit de desenvolvimento de agentes (ADK), LangChain, LangGraph |
Implantar em produção com a CLI Agents
A CLI de agentes é a interface de linha de comando e o conjunto de habilidades unificados para a Gemini Enterprise Agent Platform. Ele oferece aos agentes e desenvolvedores de programação um caminho previsível pelo ciclo de vida de desenvolvimento de agentes: estruturar, avaliar, implantar, publicar e observar. A CLI de agentes oferece o seguinte:
- Modelos de agentes pré-criados:ReAct, RAG, multiagente e outros modelos.
- Playground interativo: teste e interaja com seu agente.
- Infraestrutura automatizada: usa o Terraform para simplificar o gerenciamento de recursos.
- Pipelines de CI/CD: fluxos de trabalho de implantação automatizados que usam o Cloud Build.
- Observabilidade: suporte integrado para o Cloud Trace e o Cloud Logging.
Para começar, consulte o Guia de início rápido.
Casos de uso
Para saber mais sobre o Agent Runtime com exemplos completos, consulte os seguintes recursos:
Clique para abrir os casos de uso
| Caso de uso | Descrição | Links | |
|---|---|---|---|
| Criar agentes conectando-se a APIs públicas | Converta entre moedas. Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?" |
Notebook do SDK da Agent Platform (Python): introdução à criação e implantação de um agente com o Agent Runtime | |
| Projetando um projeto solar comunitário. Identifique locais potenciais, procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares. |
Notebook do Agent Platform SDK (Python): como criar e implantar um agente da API Google Maps com o Agent Runtime | ||
| Criar agentes conectando-se a bancos de dados | Integração com o AlloyDB e o Cloud SQL para PostgreSQL. | Postagem do blog: anúncio da LangChain na Gemini Enterprise Agent Platform para AlloyDB e Cloud SQL para PostgreSQL Notebook do SDK da Agent Platform (Python): como implantar um aplicativo RAG com o Cloud SQL para PostgreSQL no tempo de execução do agente Notebook do SDK da Agent Platform (Python): como implantar um aplicativo RAG com o AlloyDB para PostgreSQL no tempo de execução do agente |
|
| Crie agentes com ferramentas que acessam dados no seu banco de dados. | Notebook do SDK da Agent Platform (Python): como implantar um agente com o Agent Runtime e o MCP Toolbox for Databases | ||
| Consultar e entender repositórios de dados estruturados usando linguagem natural. | Notebook do SDK da Agent Platform (Python): como criar um agente de pesquisa de conversação com o Agent Runtime e a RAG na Pesquisa de agentes | ||
| Consulte e entenda bancos de dados de gráficos usando linguagem natural | Postagem do blog: GenAI GraphRAG e agentes de IA usando o ambiente de execução do agente com o LangChain e o Neo4j | ||
| Consultar e entender repositórios de vetores usando linguagem natural | Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Agent Runtime | ||
| Criar agentes com o Kit de Desenvolvimento de Agente | Crie e implante agentes usando o Kit de Desenvolvimento de Agente. | Kit de Desenvolvimento de Agente: implantação no Agent Runtime | |
| Criar agentes com frameworks de OSS | Crie e implante agentes usando o framework de código aberto OneTwo. | Postagem do blog: OneTwo e Agent Runtime: explorando o desenvolvimento avançado de agentes de IA no Google Cloud | |
| Crie e implante agentes usando o framework de código aberto LangGraph. | Notebook do SDK da Agent Platform (Python): como criar e implantar um aplicativo LangGraph com o Agent Runtime | ||
| Depuração e otimização de agentes | Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace. | Notebook do SDK da Agent Platform (Python): depuração e otimização de agentes: um guia de rastreamento no Agent Runtime | |
| Criar sistemas multiagente com o protocolo A2A (prévia) | Crie agentes interoperáveis que se comuniquem e colaborem com outros agentes, independente da estrutura deles. | Para mais informações, consulte a documentação do protocolo A2A. | |
Segurança empresarial
O Agent Runtime oferece suporte a vários recursos para ajudar você a atender aos requisitos de segurança empresarial, aderir às políticas de segurança da sua organização e seguir as práticas recomendadas de segurança. Os seguintes recursos são compatíveis:
VPC Service Controls: o Agent Runtime é compatível com o VPC Service Controls para reforçar a segurança de dados e reduzir os riscos de exfiltração de dados. Para mais informações, consulte VPC Service Controls do tempo de execução do agente.
Interface do Private Service Connect: para o tempo de execução do agente, o PSC-I permite que seus agentes interajam com serviços hospedados de maneira privada na VPC de um usuário. Para mais informações, consulte Como usar a interface do Private Service Connect com o Agent Runtime.
Chaves de criptografia gerenciadas pelo cliente (CMEK): o tempo de execução do agente é compatível com CMEK para proteger seus dados com suas próprias chaves de criptografia, o que dá a você a propriedade e o controle total das chaves que protegem seus dados em repouso no Google Cloud. Para mais informações, consulte CMEK do ambiente de execução do agente.
Residência de dados (DRZ): o tempo de execução do agente é compatível com a residência de dados (DRZ) para garantir que todos os dados em repouso sejam armazenados na região especificada.
HIPAA: como parte da Agent Platform, o Agent Runtime oferece suporte a cargas de trabalho da HIPAA.
Transparência no acesso: a Transparência no acesso fornece registros que capturam as ações realizadas pela equipe do Google ao acessar seu conteúdo. Para mais informações sobre como ativar a Transparência no acesso para o tempo de execução do agente, consulte Agent Platform.
A tabela a seguir mostra quais recursos de segurança empresarial são compatíveis com cada serviço da Agent Platform:
| Recurso de segurança | Agent Runtime | Sessões | Memory Bank | Exemplo de repositório | execução de código |
|---|---|---|---|---|---|
| VPC Service Controls | Sim | Sim | Sim | Não | Sim |
| Chaves de criptografia gerenciadas pelo cliente | Sim | Sim | Sim | Não | Sim |
| Residência de dados (DRZ) em repouso | Sim | Sim | Sim | Não | Sim |
| HIPAA | Sim | Sim | Sim | Sim | Sim |
| Transparência no acesso | Sim | Sim | Sim | Não | Não |
| Aprovação de acesso | Sim | Sim | Sim | Não | Não |
Regiões compatíveis
Consulte Locais para conferir uma lista de regiões compatíveis com o tempo de execução do agente.
Cota
Consulte Cotas e limites do sistema para informações sobre cotas do tempo de execução do agente.
Preços
Um nível sem custo financeiro está disponível para o Agent Runtime. Para informações sobre preços do Agent Runtime, consulte os preços da Gemini Enterprise Agent Platform.
Migração para o SDK baseado em cliente
O módulo agent_engines no SDK da Agent Platform está sendo refatorado para um design baseado em cliente pelos seguintes motivos principais:
- Para se alinhar ao Kit de Desenvolvimento de Agente (ADK) e ao SDK de IA generativa do Google em representações de tipo canônico. Isso garante uma maneira consistente e padronizada de representar tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz o overhead de conversão.
- Para escopo no nível do cliente de parâmetros Google Cloud em aplicativos de vários projetos e locais. Isso permite que um aplicativo gerencie interações com recursos em diferentes projetos do Google Cloud e locais geográficos configurando cada instância do cliente com as configurações específicas de projeto e local.
- Para melhorar a capacidade de descoberta e a coesão dos serviços do Agent Runtime
A seguir
Configuração do Agent Platform runtime
Configure seu ambiente para usar o Agent Platform Runtime.