O Agent Runtime é um conjunto de serviços que permite aos desenvolvedores implantar, gerenciar e escalonar agentes de IA em produção. O Agent Runtime cuida da infraestrutura para escalonar agentes em produção, para que você possa se concentrar na criação de aplicativos. O Agent Runtime oferece os seguintes serviços que podem ser usados individualmente ou em combinação:
- Ambiente de execução:
- Implante e escalone agentes com um ambiente de execução gerenciado e recursos de gerenciamento completos.
- Personalize a imagem de contêiner do agente com scripts de instalação no momento da criação para dependências do sistema.
- Use recursos de segurança, incluindo o compliance com o VPC-SC, configuração de autenticação e o IAM.
- Acesse modelos e ferramentas com chamadas de função.
- Implante agentes criados usando diferentes frameworks do Python e o protocolo aberto Agent2Agent.
- Qualidade e avaliação (visualização): avalie a qualidade do agente com o serviço de avaliação de IA generativa integrado e otimize os agentes com execuções treinamento de modelo do Gemini.
- Sessões da plataforma de agentes: permitem armazenar interações individuais entre usuários e agentes, fornecendo fontes definitivas para o contexto da conversa.
- Memory Bank da plataforma de agentes: Tempo de execução do agente O Memory Bank da plataforma de agentes permite armazenar e recuperar informações de sessões para personalizar interações de agentes.
- Execução de código: permite que o agente execute código em um ambiente de sandbox seguro, isolado, e gerenciado.
- Exemplo de repositório (visualização): armazene e recupere dinamicamente exemplos de few-shot para melhorar o desempenho do agente.
- Observabilidade: entenda o comportamento do agente com o Google Cloud Trace (compatível com o OpenTelemetry), Cloud Monitoring e Cloud Logging.
- Governança: o Agent Runtime oferece suporte a vários recursos para ajudar você a
governar agentes em produção e atender às necessidades de segurança e empresariais:
- Detectar ameaças com o Security Command Center: a detecção de ameaças do Agent Runtime (visualização) é um serviço integrado do Security Command Center que ajuda a detectar e investigar possíveis ataques a agentes implantados no Agent Runtime.
- Identidade do agente (visualização): use a identidade do agente do Identity Access Management (IAM) para fornecer recursos de segurança e gerenciamento de acesso ao usar agentes no Agent Runtime.
- Gateway de agentes (visualização): use o gateway de agentes para definir regras para comunicações de agentes e aplicar políticas de segurança e controle de acesso em agentes, clientes e ferramentas que se conectam ao seu projeto. Google Cloud
Criar e implantar no Agent Runtime
O fluxo de trabalho para criar um agente no Agent Runtime é:
- Configurar o ambiente: configure seu projeto do Google e instale a versão mais recente do SDK da plataforma de agentes para Python.
- **Desenvolver um agente**: Desenvolver um agente que possa ser implantado no Agent Runtime.
- Implantar o agente: Implante o agente no ambiente de execução gerenciado do Agent Runtime.
- Usar o agente: consulte o agente enviando uma solicitação de API.
- Gerenciar o agente implantado: gerencie e exclua os agentes que você implantou no Agent Runtime.
As etapas estão ilustradas no diagrama a seguir:
Frameworks compatíveis
A tabela a seguir descreve o nível de suporte que o Agent Runtime oferece para vários frameworks de agentes:
| Nível de suporte | Frameworks de agentes |
|---|---|
| Modelo personalizado: é possível adaptar um modelo personalizado para oferecer suporte a implantação no Agent Runtime do seu framework. | CrewAI, frameworks personalizados |
| Integração do SDK da plataforma de agentes: o Agent Runtime fornece modelos gerenciados por framework no SDK da plataforma de agentes e na documentação. | AG2, LlamaIndex |
| Integração completa: os recursos são integrados para funcionar em todo o framework, o Agent Runtime e o ecossistema mais amplo Google Cloud . | Kit de Desenvolvimento de Agente (ADK), LangChain, LangGraph |
Implantar na produção com a CLI Agents
A CLI Agents é a interface de linha de comando unificada e o conjunto de habilidades da plataforma de agentes do Gemini Enterprise. Ela oferece aos agentes de programação e desenvolvedores um caminho previsível pelo ciclo de vida de desenvolvimento de agentes: scaffold, avaliar, implantar, publicar e observar. A CLI Agents oferece o seguinte:
- Modelos de agentes pré-criados:ReAct, RAG, multiagente e outros modelos.
- Playground interativo: teste e interaja com seu agente.
- Infraestrutura automatizada: usa o Terraform para gerenciamento de recursos simplificado.
- Pipelines de CI/CD: fluxos de trabalho de implantação automatizados que aproveitam o Cloud Build.
- Observabilidade: suporte integrado para Cloud Trace e Cloud Logging.
Para começar, consulte o Guia de início rápido.
Casos de uso
Para saber mais sobre o Agent Runtime com exemplos completos, consulte os seguintes recursos:
Clique para expandir os casos de uso
| Caso de uso | Descrição | Links | |
|---|---|---|---|
| Criar agentes conectando-se a APIs públicas | Converta entre moedas. Criar uma função que se conecta a um app de câmbio de moedas, permitindo ao modelo fornecer respostas precisas a consultas como "Qual é a taxa de câmbio de reais para dólares hoje?" |
Notebook do SDK da plataforma de agentes (Python): introdução à criação e implantação de um agente com o Agent Runtime | |
| Projetando um projeto de energia solar comunitária. Identifique locais potenciais procure escritórios e fornecedores governamentais relevantes e analise imagens de satélite e o potencial solar de regiões e edifícios para encontrar o local ideal para instalar os painéis solares. |
Notebook do SDK da plataforma de agentes (Python): como criar e implantar um agente da API Google Maps com o Agent Runtime | ||
| Criar agentes conectando-se a bancos de dados | Integração com o AlloyDB e o Cloud SQL para PostgreSQL. | Postagem do blog: anúncio do LangChain na plataforma de agentes do Gemini Enterprise para AlloyDB e Cloud SQL para PostgreSQL Notebook do SDK da plataforma de agentes (Python): implantação de um aplicativo RAG com o Cloud SQL para PostgreSQL no Agent Runtime Notebook do SDK da plataforma de agentes (Python): implantação de um aplicativo RAG com o AlloyDB para PostgreSQL no Agent Runtime |
|
| Criar agentes com ferramentas que acessam dados no seu banco de dados. | Notebook do SDK da plataforma de agentes (Python): implantação de um agente com o Agent Runtime e o MCP Toolbox para bancos de dados | ||
| Consultar e entender repositórios de dados estruturados usando linguagem natural. | Notebook do SDK da plataforma de agentes (Python): como criar um agente de pesquisa de conversação com o Agent Runtime e a RAG na pesquisa de agentes | ||
| Consulte e entenda bancos de dados de gráficos usando linguagem natural | Postagem do blog: GenAI GraphRAG e agentes de IA usando o Agent Runtime com o LangChain e o Neo4j | ||
| Consultar e entender repositórios de vetores usando linguagem natural | Postagem do blog: simplificar a RAG da IA generativa com o MongoDB Atlas e o Agent Runtime | ||
| Criar agentes com o Kit de Desenvolvimento de Agente | Crie e implante agentes usando o Kit de Desenvolvimento de Agente. | Kit de Desenvolvimento de Agente: implantação no Agent Runtime | |
| Criar agentes com frameworks de OSS | Crie e implante agentes usando o framework de código aberto OneTwo. | Postagem do blog: OneTwo e Agent Runtime: explorando o desenvolvimento avançado de agentes de IA no Google Cloud | |
| Crie e implante agentes usando o framework de código aberto LangGraph. | Notebook do SDK da plataforma de agentes (Python): criar e implantar um aplicativo LangGraph com o Agent Runtime | ||
| Depuração e otimização de agentes | Crie e rastreie agentes usando o OpenTelemetry e o Cloud Trace. | Notebook do SDK da plataforma de agentes (Python): depuração e otimização de agentes: um guia de rastreamento no Agent Runtime | |
| Criar sistemas multiagentes com o protocolo A2A (visualização) | Crie agentes interoperáveis que se comunicam e colaboram com outros agentes, independentemente do framework. | Para mais informações, consulte a documentação do protocolo A2A. | |
Segurança corporativa
O Agent Runtime oferece suporte a vários recursos para ajudar você a atender aos requisitos de segurança corporativa, aderir às políticas de segurança da sua organização e seguir as práticas recomendadas de segurança. Os seguintes recursos são compatíveis:
VPC Service Controls: o Agent Runtime oferece suporte ao VPC Service Controls para fortalecer a segurança de dados e reduzir os riscos de exfiltração de dados. Para mais informações, consulte VPC Service Controls do Agent Runtime.
Interface do Private Service Connect: para o Agent Runtime, o PSC-I permite que seus agentes interajam com serviços hospedados de maneira particular na VPC de um usuário. Para mais informações, consulte Como usar a interface do Private Service Connect com o Agent Runtime.
Chaves de criptografia gerenciadas pelo cliente (CMEK): o Agent Runtime oferece suporte a CMEK para proteger seus dados com suas próprias chaves de criptografia, o que oferece propriedade e controle total das chaves que protegem seus dados em repouso no Google Cloud. Para mais informações, consulte CMEK do Agent Runtime.
Residência de dados (DRZ): o Agent Runtime oferece suporte à residência de dados (DRZ) para garantir que todos os dados em repouso sejam armazenados na região especificada.
HIPAA: como parte da plataforma de agentes, o Agent Runtime oferece suporte a cargas de trabalho HIPAA.
Transparência no acesso: a transparência no acesso fornece registros que capturam as ações executadas pela equipe do Google ao acessar seu conteúdo. Para mais informações sobre como ativar a transparência no acesso para o Agent Runtime, consulte Transparência no acesso na plataforma de agentes.
A tabela a seguir mostra quais recursos de segurança corporativa são compatíveis com cada serviço da plataforma de agentes:
| Recurso de segurança | Agent Runtime | Sessões | Memory Bank | Exemplo de repositório | execução de código |
|---|---|---|---|---|---|
| VPC Service Controls | Sim | Sim | Sim | Não | Sim |
| Chaves de criptografia gerenciadas pelo cliente | Sim | Sim | Sim | Não | Sim |
| Residência de dados (DRZ) em repouso | Sim | Sim | Sim | Não | Sim |
| HIPAA | Sim | Sim | Sim | Sim | Sim |
| Transparência no acesso | Sim | Sim | Sim | Não | Não |
| Aprovação de acesso | Sim | Sim | Sim | Não | Não |
Regiões compatíveis
Consulte Locais para conferir uma lista de regiões compatíveis com o Agent Runtime.
Quota
Consulte Cotas e limites do sistema para informações sobre a cota do Agent Runtime.
Preços
Um nível sem custo financeiro está disponível para o Agent Runtime. Para informações sobre preços do Agent Runtime, consulte Preços da plataforma de agentes do Gemini Enterprise preços.
Migração para o SDK baseado no cliente
O módulo agent_engines no SDK da plataforma de agentes está sendo refatorado para um design baseado no cliente pelos seguintes motivos principais:
- Para se alinhar ao Kit de Desenvolvimento de Agente (ADK) e ao SDK de IA Generativa do Google em representações de tipo canônico. Isso garante uma maneira consistente e padronizada de representar tipos de dados em diferentes SDKs, o que simplifica a interoperabilidade e reduz a sobrecarga de conversão.
- Para o escopo de Google Cloud parâmetros no nível do cliente em aplicativos multirregionais de vários projetos. Isso permite que um aplicativo gerencie interações com recursos em diferentes Google Cloud projetos e locais geográficos configurando cada instância do cliente com as configurações específicas de projeto e local.
- Para melhorar a capacidade de descoberta e a coesão dos serviços do Agent Runtime
A seguir
Configuração do ambiente de execução da plataforma de agentes
Configure seu ambiente para usar o ambiente de execução da plataforma de agentes.