Agent Runtime è un insieme di servizi che consente agli sviluppatori di eseguire il deployment, gestire e scalare gli agenti AI in produzione. Agent Runtime gestisce l'infrastruttura per scalare gli agenti in produzione, così da potersi concentrare sulla creazione di applicazioni. Agent Runtime offre i seguenti servizi che puoi utilizzare singolarmente o in combinazione:
- Runtime:
- Esegui il deployment e la scalabilità degli agenti con un runtime gestito e funzionalità di gestione end-to-end.
- Personalizza l'immagine container dell'agente con script di installazione in fase di build per le dipendenze di sistema.
- Utilizza le funzionalità di sicurezza, tra cui la conformità a VPC-SC e la configurazione dell'autenticazione e di IAM.
- Accedi a modelli e strumenti come la chiamata di funzioni.
- Esegui il deployment di agenti creati utilizzando diversi framework Python e il protocollo aperto Agent2Agent.
- Qualità e valutazione (anteprima): valuta la qualità degli agenti con il servizio di valutazione di AI generativa integrato e ottimizza gli agenti con le sessioni di addestramento del modello Gemini.
- Sessioni di Agent Platform: le sessioni di Agent Platform ti consentono di archiviare le singole interazioni tra utenti e agenti, fornendo origini definitive per il contesto della conversazione.
- Memory Bank di Agent Platform: Runtime dell'agente Memory Bank di Agent Platform ti consente di archiviare e recuperare informazioni dalle sessioni per personalizzare le interazioni degli agenti.
- Esegui il codice: l'esecuzione del codice di Agent Runtime consente all'agente di eseguire il codice in un ambiente sandbox sicuro, isolato, e gestito.
- Example Store (anteprima): archivia e recupera in modo dinamico esempi few-shot per migliorare il rendimento degli agenti.
- Osservabilità: comprendi il comportamento degli agenti con Google Cloud Trace (che supporta OpenTelemetry), Cloud Monitoring e Cloud Logging.
- Governance: Agent Runtime supporta diverse funzionalità per aiutarti a
gestire gli agenti in produzione e soddisfare le esigenze di sicurezza e aziendali:
- Rileva le minacce con Security Command Center: il rilevamento delle minacce di Agent Runtime (anteprima) è un servizio integrato di Security Command Center che ti aiuta a rilevare e analizzare potenziali attacchi agli agenti di cui è stato eseguito il deployment in Agent Runtime.
- Identità dell'agente (anteprima): utilizza l'identità dell'agente di Identity Access Management (IAM) per fornire funzionalità di sicurezza e gestione degli accessi quando utilizzi gli agenti in Agent Runtime.
- Agent Gateway (anteprima): utilizza Agent Gateway per definire le regole per le comunicazioni agentiche e applicare le policy di sicurezza e controllo dell'accesso tra agenti, client e strumenti che si connettono al tuo Google Cloud progetto e da questo.
Crea ed esegui il deployment in Agent Runtime
Il workflow per la creazione di un agente in Agent Runtime è il seguente:
- Configura l'ambiente: configura il tuo progetto Google e installa l'ultima versione dell'SDK Agent Platform per Python.
- Sviluppa un agente: Sviluppa un agente di cui è possibile eseguire il deployment in Agent Runtime.
- Esegui il deployment dell'agente: Esegui il deployment dell'agente nel runtime gestito di Agent Runtime.
- **Utilizza l'agente**: esegui una query sull' agente inviando una richiesta API.
- Gestisci l'agente di cui è stato eseguito il deployment: gestisci ed elimina gli agenti di cui hai eseguito il deployment in Agent Runtime.
I passaggi sono illustrati nel seguente diagramma:
Framework supportati
La tabella seguente descrive il livello di supporto fornito da Agent Runtime per vari framework di agenti:
| Livello di assistenza | Framework di agenti |
|---|---|
| Modello personalizzato: puoi adattare un modello personalizzato per supportare il deployment in Agent Runtime dal tuo framework. | CrewAI, framework personalizzati |
| Integrazione dell'SDK Agent Platform: Agent Runtime fornisce modelli gestiti per framework nell'SDK Agent Platform e nella documentazione. | AG2, LlamaIndex |
| Integrazione completa: le funzionalità sono integrate per funzionare nel framework, in Agent Runtime e nell'ecosistema più ampio Google Cloud . | Agent Development Kit (ADK), LangChain, LangGraph |
Esegui il deployment in produzione con l'interfaccia a riga di comando Agents
L'interfaccia a riga di comando Agents è l'interfaccia a riga di comando e il set di competenze unificati per la piattaforma agentica Gemini Enterprise. Fornisce agli agenti di codifica e agli sviluppatori un percorso prevedibile attraverso il ciclo di vita dello sviluppo degli agenti: scaffolding, valutazione, deployment, pubblicazione e osservazione. L'interfaccia a riga di comando Agents fornisce quanto segue:
- Modelli di agenti predefiniti:ReAct, RAG, multi-agente e altri modelli.
- Playground interattivo: testa e interagisci con l'agente.
- Infrastruttura automatizzata: utilizza Terraform per una gestione semplificata delle risorse.
- Pipeline CI/CD: workflow di deployment automatizzati che sfruttano Cloud Build.
- Osservabilità: supporto integrato per Cloud Trace e Cloud Logging.
Per iniziare, consulta la Guida rapida.
Casi d'uso
Per scoprire di più su Agent Runtime con esempi end-to-end, consulta le seguenti risorse:
Fai clic per espandere i casi d'uso
| Caso d'uso | Descrizione | Link | |
|---|---|---|---|
| Crea agenti collegandoti alle API pubbliche | Converti tra valute. Crea una funzione che si connette a un'app di cambio valuta, consentendo al modello di fornire risposte accurate a query come "Qual è il tasso di cambio tra euro e dollari oggi?" |
Notebook dell'SDK Agent Platform (Python) - Introduzione alla creazione e al deployment di un agente con Agent Runtime | |
| Progettazione di un impianto solare comunitario. Identifica le potenziali località, cerca gli uffici governativi e i fornitori pertinenti e esamina le immagini satellitari e il potenziale solare di regioni ed edifici per trovare la località ottimale per installare i pannelli solari. |
Notebook dell'SDK Agent Platform (Python) - Creazione e deployment di un agente dell'API di Google Maps con Agent Runtime | ||
| Crea agenti collegandoti ai database | Integrazione con AlloyDB e Cloud SQL per PostgreSQL. | Post del blog - Annuncio di LangChain sulla piattaforma agentica Gemini Enterprise per AlloyDB e Cloud SQL per PostgreSQL Notebook dell'SDK Agent Platform (Python) - Deployment di un'applicazione RAG con Cloud SQL per PostgreSQL in Agent Runtime Notebook dell'SDK Agent Platform (Python) - Deployment di un'applicazione RAG con AlloyDB per PostgreSQL in Agent Runtime |
|
| Crea agenti con strumenti che accedono ai dati nel database. | Notebook dell'SDK Agent Platform (Python) - Deployment di un agente con Agent Runtime e MCP Toolbox per database | ||
| Esegui query e comprendi i datastore strutturati utilizzando il linguaggio naturale. | Notebook dell'SDK Agent Platform (Python) - Creazione di un agente di ricerca conversazionale con Agent Runtime e RAG su Agent Search | ||
| Esegui query e comprendi i database di grafici utilizzando il linguaggio naturale | Post del blog - GenAI GraphRAG e agenti AI che utilizzano Agent Runtime con LangChain e Neo4j | ||
| Esegui query e comprendi gli archivi vettoriali utilizzando il linguaggio naturale | Post del blog - Semplifica GenAI RAG con MongoDB Atlas e Agent Runtime | ||
| Crea agenti con Agent Development Kit | Crea ed esegui il deployment di agenti utilizzando Agent Development Kit. | Agent Development Kit - Esegui il deployment in Agent Runtime | |
| Crea agenti con framework OSS | Crea ed esegui il deployment di agenti utilizzando il framework open source OneTwo. | Post del blog - OneTwo e Agent Runtime: esplorazione dello sviluppo avanzato di agenti AI su Google Cloud | |
| Crea ed esegui il deployment di agenti utilizzando il framework open source LangGraph. | Notebook dell'SDK Agent Platform (Python) - Creazione e deployment di un'applicazione LangGraph con Agent Runtime | ||
| Esegui il debug e ottimizza gli agenti | Crea e traccia gli agenti utilizzando OpenTelemetry e Cloud Trace. | Notebook dell'SDK Agent Platform (Python) - Eseguire il debug e ottimizzare gli agenti: una guida al tracciamento in Agent Runtime | |
| Crea sistemi multi-agente con il protocollo A2A (anteprima) | Crea agenti interoperabili che comunicano e collaborano con altri agenti indipendentemente dal loro framework. | Per ulteriori informazioni, consulta la documentazione del protocollo A2A. | |
Sicurezza aziendale
Agent Runtime supporta diverse funzionalità per aiutarti a soddisfare i requisiti di sicurezza aziendale, rispettare le policy di sicurezza della tua organizzazione e seguire le best practice di sicurezza. Sono supportate le seguenti funzionalità:
Controlli di servizio VPC: Agent Runtime supporta i Controlli di servizio VPC per rafforzare la sicurezza dei dati e mitigare i rischi di esfiltrazione di dati. Quando i Controlli di servizio VPC sono configurati, l'agente di cui è stato eseguito il deployment mantiene l'accesso sicuro alle API di Google e ai servizi, come l'API BigQuery, l'API Cloud SQL Admin e l'API Agent Platform, verificando il funzionamento senza interruzioni all'interno del perimetro definito. È fondamentale che i Controlli di servizio VPC blocchino efficacemente tutti gli accessi a internet pubblici, limitando il movimento dei dati ai confini della rete autorizzata e migliorando significativamente la strategia di sicurezza aziendale.
I Controlli di servizio VPC non sono supportati con Agent Gateway. Tuttavia, puoi utilizzare i vincoli delle policy dell'organizzazione personalizzati per limitare i gateway che possono essere associati agli agenti. Per ulteriori informazioni, consulta la sezione Instradare il traffico tramite Agent Gateway.
Interfaccia Private Service Connect: per Agent Runtime, PSC-I consente agli agenti di interagire con i servizi ospitati privatamente nel VPC di un utente. Per ulteriori informazioni, consulta la sezione Utilizzare l'interfaccia Private Service Connect con Agent Runtime.
Chiavi di crittografia gestite dal cliente (CMEK): Agent Runtime supporta CMEK per proteggere i dati con le tue chiavi di crittografia, che ti danno la proprietà e il controllo completo delle chiavi che proteggono i tuoi dati at-rest in Google Cloud. Per ulteriori informazioni, consulta la sezione Agent Runtime CMEK.
Residenza dei dati (DRZ): Agent Runtime supporta la residenza dei dati (DRZ) per garantire che tutti i dati at-rest siano archiviati nella regione specificata.
HIPAA: nell'ambito di Agent Platform, Agent Runtime supporta i workload HIPAA.
Access Transparency: Access Transparency ti fornisce log che acquisiscono le azioni intraprese dal personale di Google quando accede ai tuoi contenuti. Per ulteriori informazioni su come attivare Access Transparency per Agent Runtime, consulta la sezione Access Transparency in Agent Platform.
La tabella seguente mostra le funzionalità di sicurezza aziendale supportate per ogni servizio Agent Platform:
| Funzionalità di sicurezza | Agent Runtime | Sessioni | Memory Bank | Example Store | Esecuzione del codice |
|---|---|---|---|---|---|
| Controlli di servizio VPC | Sì | Sì | Sì | No | Sì |
| Chiavi di crittografia gestite dal cliente | Sì | Sì | Sì | No | Sì |
| Residenza dei dati (DRZ) a riposo | Sì | Sì | Sì | No | Sì |
| HIPAA | Sì | Sì | Sì | Sì | Sì |
| Access Transparency | Sì | Sì | Sì | No | No |
| Approvazione accesso | Sì | Sì | Sì | No | No |
Aree geografiche supportate
Consulta Località per un elenco delle regioni supportate per Agent Runtime.
Quota
Consulta Quota e limiti di sistema per informazioni sulla quota di Agent Runtime.
Prezzi
È disponibile un livello senza costi per Agent Runtime. Per informazioni sui prezzi di Agent Runtime, consulta la pagina relativa ai prezzi della piattaforma agentica Gemini Enterprise .
Migrazione all'SDK basato su client
Il modulo agent_engines all'interno dell'SDK Agent Platform viene sottoposto a refactoring in un design basato su client per i seguenti motivi principali:
- Per allinearsi all'Agent Development Kit (ADK) e all' SDK Google Gen AI nelle rappresentazioni di tipo canonico. In questo modo si garantisce un modo coerente e standardizzato di rappresentare i tipi di dati in diversi SDK, il che semplifica l'interoperabilità e riduce il sovraccarico di conversione.
- Per l'ambito a livello di client dei Google Cloud parametri nelle applicazioni multi-progetto e multi-regione. In questo modo, un'applicazione può gestire le interazioni con le risorse in diversi Google Cloud progetti e località geografiche configurando ogni istanza client con le impostazioni specifiche di progetto e località.
- Per migliorare la rilevabilità e la coesione dei servizi di Agent Runtime
Passaggi successivi
Configurazione del runtime di Agent Platform
Configura l'ambiente per utilizzare il runtime di Agent Platform.