O Agent Runtime é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e escalonar agentes de IA em produção. O Agent Runtime cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O ambiente de execução do agente oferece os seguintes serviços que podem ser usados individualmente ou em combinação:
- Tempo de execução:
- Implante e escalone agentes com um ambiente de execução gerenciado e recursos de gerenciamento completos.
- Personalize a imagem do contêiner do agente com scripts de instalação no momento da build para dependências do sistema.
- Use recursos de segurança, incluindo o compliance com o VPC-SC, configuração de autenticação e o IAM.
- Acesse modelos e ferramentas como chamada de função.
- Implante agentes criados usando diferentes frameworks do Python e o protocolo aberto Agent2Agent.
- Qualidade e avaliação (prévia): avalie a qualidade do agente com o Serviço de avaliação de IA generativa integrado e otimize os agentes com execuções de treinamento de modelo Gemini.
- Sessões da plataforma do agente: permitem armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.
- Memory Bank da Agent Platform: o Agent Runtime permite armazenar e recuperar informações de sessões para personalizar as interações do agente.
- Execução de código: a execução de código do ambiente de execução do agente permite que ele execute código em um ambiente de sandbox seguro, isolado e gerenciado.
- Example Store (prévia): armazene e recupere dinamicamente exemplos de few-shot para melhorar a performance do agente.
- Observabilidade: entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), o Cloud Monitoring e o Cloud Logging.
- Governança: o ambiente de execução do agente oferece suporte a vários recursos para ajudar você a governar agentes em produção e atender às suas necessidades de segurança e empresariais:
- Detectar ameaças com o Security Command Center: a detecção de ameaças de ambiente de execução do agente (prévia) é um serviço integrado do Security Command Center que ajuda a detectar e investigar possíveis ataques a agentes implantados no ambiente de execução do agente.
- Identidade do agente (prévia): use a identidade do agente do gerenciamento de identidade e acesso (IAM) para fornecer recursos de segurança e gerenciamento de acesso ao usar agentes no tempo de execução do agente.
- Gateway de agente (prévia): use o Gateway de agente para definir regras de comunicações de agentes e aplicar políticas de segurança e controle de acesso em agentes, clientes e ferramentas que se conectam ao seu projetoGoogle Cloud .
Criar e implantar no Agent Runtime
O fluxo de trabalho para criar um agente no Agent Runtime é:
- Configure o ambiente: configure seu projeto do Google e instale a versão mais recente do SDK da plataforma de agentes para Python.
- Desenvolver um agente: desenvolva um agente que possa ser implantado no Agent Runtime.
- Implante o agente: implante o agente no ambiente de execução gerenciado do Agent Runtime.
- Usar o agente: consulte o agente enviando uma solicitação de API.
- Gerenciar o agente implantado: gerencie e exclua os agentes implantados no Agent Runtime.
As etapas estão ilustradas no diagrama a seguir:
Frameworks compatíveis
A tabela a seguir descreve o nível de suporte que o ambiente de execução do agente oferece para várias estruturas de agente:
| Nível de suporte | Frameworks de agentes |
|---|---|
| Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte à implantação no ambiente de execução do agente usando seu framework. | CrewAI, estruturas personalizadas |
| Integração do SDK da plataforma de agentes: o Agent Runtime fornece modelos gerenciados por framework no SDK da plataforma de agentes e na documentação. | AG2, LlamaIndex |
| Integração completa: os recursos são integrados para funcionar em todo o framework, no ambiente de execução do agente e no ecossistema Google Cloud mais amplo. | Kit de desenvolvimento de agentes (ADK), LangChain, LangGraph |
Implantar em produção com a CLI Agents
A CLI de agentes é a interface de linha de comando e o conjunto de habilidades unificados para a plataforma de agentes do Gemini Enterprise. Ele oferece aos agentes e desenvolvedores de programação um caminho previsível pelo ciclo de vida de desenvolvimento de agentes: estruturar, avaliar, implantar, publicar e observar. A CLI Agents oferece o seguinte:
- Modelos de agentes predefinidos:ReAct, RAG, multiagente e outros modelos.
- Playground interativo: teste e interaja com seu agente.
- Infraestrutura automatizada: usa o Terraform para gerenciamento simplificado de recursos.
- Pipelines de CI/CD: fluxos de trabalho de implantação automatizada que usam o Cloud Build.
- Observabilidade: suporte integrado para o Cloud Trace e o Cloud Logging.
Para começar, consulte o Guia de início rápido.
Casos de uso
Para saber mais sobre o Agent Runtime com exemplos completos, consulte os seguintes recursos:
Clique para abrir os casos de uso
Segurança corporativa
O Agent Runtime oferece suporte a vários recursos para ajudar você a atender aos requisitos de segurança empresarial, aderir às políticas de segurança da sua organização e seguir as práticas recomendadas de segurança. Há suporte para os seguintes recursos:
VPC Service Controls: o Agent Runtime é compatível com o VPC Service Controls para reforçar a segurança de dados e reduzir os riscos de exfiltração de dados. Quando o VPC Service Controls está configurado, o agente implantado mantém o acesso seguro a APIs e serviços do Google, como API BigQuery, API Cloud SQL Admin e API Agent Platform, verificando a operação perfeita dentro do perímetro definido. O VPC Service Controls bloqueia todo o acesso público à Internet, confinando a movimentação de dados aos limites da rede autorizada e melhorando significativamente a postura de segurança da empresa.
O VPC Service Controls não é compatível com o Agent Gateway. No entanto, é possível usar restrições personalizadas da política da organização para restringir quais gateways podem ser associados aos seus agentes. Para mais informações, consulte Encaminhar o tráfego pela Agent Gateway.
Interface do Private Service Connect: para o tempo de execução do agente, o PSC-I permite que seus agentes interajam com serviços hospedados de maneira privada na VPC de um usuário. Para mais informações, consulte Como usar a interface do Private Service Connect com o Agent Runtime.
Chaves de criptografia gerenciadas pelo cliente (CMEK): o tempo de execução do agente é compatível com CMEK para proteger seus dados com suas próprias chaves de criptografia, o que dá a você a propriedade e o controle total das chaves que protegem seus dados em repouso no Google Cloud. Para mais informações, consulte CMEK do ambiente de execução do agente.
Residência de dados (DRZ): o tempo de execução do agente é compatível com a residência de dados (DRZ) para garantir que todos os dados em repouso sejam armazenados na região especificada.
HIPAA: como parte da Agent Platform, o Agent Runtime oferece suporte a cargas de trabalho da HIPAA.
Transparência no acesso: a Transparência no acesso fornece registros que capturam as ações realizadas pela equipe do Google ao acessar seu conteúdo. Para mais informações sobre como ativar a Transparência no acesso para o Agent Runtime, consulte Transparência no acesso na plataforma de agentes.
A tabela a seguir mostra quais recursos de segurança empresarial são compatíveis com cada serviço da plataforma do agente:
| Recurso de segurança | Agent Runtime | Sessões | Banco de memória | Exemplo de repositório | execução de código |
|---|---|---|---|---|---|
| VPC Service Controls | Sim | Sim | Sim | Não | Sim |
| Chaves de criptografia gerenciadas pelo cliente | Sim | Sim | Sim | Não | Sim |
| Residência dos dados (DRZ) em repouso | Sim | Sim | Sim | Não | Sim |
| HIPAA | Sim | Sim | Sim | Sim | Sim |
| Transparência no acesso | Sim | Sim | Sim | Não | Não |
| Aprovação de acesso | Sim | Sim | Sim | Não | Não |
Regiões compatíveis
Consulte Locais para ver uma lista de regiões compatíveis com o tempo de execução do agente.
Cota
Consulte Cotas e limites do sistema para informações sobre cotas do tempo de execução do agente.
Preços
Um nível sem custo financeiro está disponível para o Agent Runtime. Para informações sobre preços do Agent Runtime, consulte os preços da plataforma de agentes do Gemini Enterprise.
Migração para o SDK baseado em cliente
O módulo agent_engines no SDK da Plataforma de Agentes está sendo refatorado para um
design baseado em cliente pelos seguintes motivos principais:
- Para se alinhar ao Kit de Desenvolvimento de Agente (ADK) e ao SDK de IA generativa do Google em representações de tipo canônico. Isso garante uma maneira consistente e padronizada de representar tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz o overhead de conversão.
- Para escopo no nível do cliente de parâmetros Google Cloud em aplicativos de vários projetos e locais. Isso permite que um aplicativo gerencie interações com recursos em diferentes Google Cloud projetos e localizações geográficas configurando cada instância do cliente com as configurações específicas de projeto e localização.
- Para melhorar a capacidade de descoberta e a coesão dos serviços do Agent Runtime.
A seguir
Configuração do ambiente de execução da plataforma de agentes
Configure o ambiente para usar o ambiente de execução da plataforma de agentes.