Agent Runtime è un insieme di servizi che consente agli sviluppatori di eseguire il deployment, gestire e scalare gli agenti AI in produzione. Agent Runtime gestisce l'infrastruttura per scalare gli agenti in produzione, così da potersi concentrare sulla creazione di applicazioni. Agent Runtime offre i seguenti servizi che puoi utilizzare singolarmente o in combinazione:
- Runtime:
- Esegui il deployment e scala gli agenti con un runtime gestito e funzionalità di gestione end-to-end.
- Personalizza l'immagine container dell'agente con script di installazione in fase di compilazione per le dipendenze di sistema.
- Utilizza le funzionalità di sicurezza, tra cui la conformità a VPC-SC e la configurazione di autenticazione e IAM.
- Accedi a modelli e strumenti come la chiamata di funzioni.
- Esegui il deployment di agenti creati utilizzando diversi framework Python e il protocollo aperto Agent2Agent.
- Qualità e valutazione (anteprima): valuta la qualità dell'agente con il servizio di valutazione Gen AI integrato e ottimizza gli agenti con le esecuzioni di addestramento del modello Gemini.
- Sessioni della piattaforma dell'agente: le sessioni della piattaforma dell'agente ti consentono di memorizzare le singole interazioni tra utenti e agenti, fornendo fonti definitive per il contesto della conversazione.
- Memory Bank di Agent Platform: runtime dell'agente Memory Bank di Agent Platform ti consente di archiviare e recuperare informazioni dalle sessioni per personalizzare le interazioni dell'agente.
- Esecuzione del codice: L'esecuzione del codice di runtime dell'agente consente all'agente di eseguire il codice in un ambiente sandbox sicuro, isolato e gestito.
- Example Store (anteprima): archivia e recupera in modo dinamico esempi few-shot per migliorare il rendimento dell'agente.
- Osservabilità: comprendi il comportamento dell'agente con Google Cloud Trace (che supporta OpenTelemetry), Cloud Monitoring e Cloud Logging.
- Governance: Agent Runtime supporta diverse funzionalità per aiutarti a
gestire gli agenti in produzione e soddisfare le tue esigenze di sicurezza ed enterprise:
- Rileva le minacce con Security Command Center: Agent Runtime Threat Detection (anteprima) è un servizio integrato di Security Command Center che ti aiuta a rilevare e analizzare potenziali attacchi agli agenti di cui è stato eseguito il deployment in Agent Runtime.
- Identità dell'agente (anteprima): utilizza l'identità dell'agente Identity Access Management (IAM) per fornire funzionalità di sicurezza e gestione degli accessi quando utilizzi gli agenti su Agent Runtime.
- Agent Gateway (anteprima): utilizza Agent Gateway per definire regole per le comunicazioni degli agenti e applicare criteri di sicurezza e controllo dell'accesso dell'accesso tra agenti, client e strumenti che si connettono a e da Google Cloud progetto.
Crea ed esegui il deployment su Agent Runtime
Il flusso di lavoro per creare un agente su Agent Runtime è il seguente:
- Configura l'ambiente: configura il tuo progetto Google e installa l'ultima versione dell'SDK Agent Platform per Python.
- Sviluppa un agente: sviluppa un agente che può essere implementato su Agent Runtime.
- Esegui il deployment dell'agente: esegui il deployment dell'agente sul runtime gestito di Agent Runtime.
- Utilizza l'agente: interroga l'agente inviando una richiesta API.
- Gestisci l'agente di cui è stato eseguito il deployment: gestisci ed elimina gli agenti di cui è stato eseguito il deployment in Agent Runtime.
I passaggi sono illustrati nel seguente diagramma:
Framework supportati
La tabella seguente descrive il livello di supporto fornito da Agent Runtime per vari framework di agenti:
| Livello di assistenza | Framework degli agenti |
|---|---|
| Modello personalizzato: puoi adattare un modello personalizzato per supportare il deployment in Agent Runtime dal tuo framework. | CrewAI, framework personalizzati |
| Integrazione dell'SDK Agent Platform: Agent Runtime fornisce modelli gestiti per framework nell'SDK Agent Platform e nella documentazione. | AG2, LlamaIndex |
| Integrazione completa: le funzionalità sono integrate per funzionare nel framework, nel runtime dell'agente e nell'ecosistema Google Cloud più ampio. | Agent Development Kit (ADK), LangChain, LangGraph |
Esegui il deployment in produzione con l'interfaccia a riga di comando di Agents
Agents CLI è l'interfaccia a riga di comando e il set di competenze unificati per la piattaforma agentica Gemini Enterprise. Fornisce agli agenti di programmazione e agli sviluppatori un percorso prevedibile attraverso il ciclo di vita dello sviluppo dell'agente: impalcatura, valutazione, deployment, pubblicazione e osservazione. La CLI di Agents fornisce quanto segue:
- Modelli di agenti predefiniti:ReAct, RAG, multi-agente e altri modelli.
- Playground interattivo: testa e interagisci con il tuo agente.
- Infrastruttura automatizzata: utilizza Terraform per una gestione semplificata delle risorse.
- Pipeline CI/CD: workflow di deployment automatizzati che sfruttano Cloud Build.
- Osservabilità: supporto integrato per Cloud Trace e Cloud Logging.
Per iniziare, consulta la guida rapida.
Casi d'uso
Per scoprire di più su Agent Runtime con esempi end-to-end, consulta le seguenti risorse:
Fai clic per espandere i casi d'uso
| Caso d'uso | Descrizione | Link | |
|---|---|---|---|
| Creare agenti connettendosi alle API pubbliche | Convertire tra valute. Crea una funzione che si connette a un'app di cambio valuta, consentendo al modello di fornire risposte accurate a query come "Qual è il tasso di cambio euro-dollaro oggi?" |
Notebook dell'SDK Agent Platform (Python) - Introduzione alla creazione e al deployment di un agente con Agent Runtime | |
| Progettazione di un impianto solare comunitario. Identifica le potenziali posizioni, cerca gli uffici governativi e i fornitori pertinenti e rivedi le immagini satellitari e il potenziale solare di regioni ed edifici per trovare la posizione ottimale per installare i pannelli solari. |
Notebook SDK (Python) di Agent Platform - Creazione e deployment di un agente API di Google Maps con Agent Runtime | ||
| Creare agenti connettendosi ai database | Integrazione con AlloyDB e Cloud SQL per PostgreSQL. | Post del blog - Annuncio di LangChain sulla piattaforma di agenti Gemini Enterprise per AlloyDB e Cloud SQL per PostgreSQL Notebook SDK (Python) della piattaforma di agenti - Deployment di un'applicazione RAG con Cloud SQL per PostgreSQL in Agent Runtime Notebook SDK (Python) della piattaforma di agenti - Deployment di un'applicazione RAG con AlloyDB per PostgreSQL in Agent Runtime |
|
| Crea agenti con strumenti che accedono ai dati nel tuo database. | Blocco note SDK Agent Platform (Python) - Deployment di un agente con Agent Runtime e MCP Toolbox per Database | ||
| Esegui query e comprendi i datastore strutturati utilizzando il linguaggio naturale. | Notebook SDK Agent Platform (Python) - Building a Conversational Search Agent with Agent Runtime and RAG on Agent Search | ||
| Esegui query e comprendi i database grafici utilizzando il linguaggio naturale | Post del blog - GenAI GraphRAG e agenti AI che utilizzano Agent Runtime con LangChain e Neo4j | ||
| Esegui query e comprendi gli spazi vettoriali utilizzando il linguaggio naturale | Post del blog - Simplify GenAI RAG with MongoDB Atlas and Agent Runtime | ||
| Crea agenti con Agent Development Kit | Crea ed esegui il deployment di agenti utilizzando Agent Development Kit. | Agent Development Kit - Esegui il deployment in Agent Runtime | |
| Crea agenti con framework OSS | Crea ed esegui il deployment di agenti utilizzando il framework open source OneTwo. | Post del blog - OneTwo e Agent Runtime: esplorare lo sviluppo avanzato di agenti AI su Google Cloud | |
| Crea ed esegui il deployment di agenti utilizzando il framework open source LangGraph. | Blocco note dell'SDK Agent Platform (Python) - Creazione e deployment di un'applicazione LangGraph con Agent Runtime | ||
| Debug e ottimizzazione degli agenti | Crea e traccia agenti utilizzando OpenTelemetry e Cloud Trace. | Notebook dell'SDK Agent Platform (Python) - Debug e ottimizzazione degli agenti: una guida al tracciamento in Agent Runtime | |
| Crea sistemi multi-agente con il protocollo A2A (anteprima) | Crea agenti interoperabili che comunicano e collaborano con altri agenti indipendentemente dal loro framework. | Per saperne di più, consulta la documentazione del protocollo A2A. | |
Sicurezza aziendale
Agent Runtime supporta diverse funzionalità per aiutarti a soddisfare i requisiti di sicurezza aziendale, rispettare le norme di sicurezza della tua organizzazione e seguire le best practice di sicurezza. Sono supportate le seguenti funzionalità:
Controlli di servizio VPC: Agent Runtime supporta i Controlli di servizio VPC per rafforzare la sicurezza dei dati e mitigare i rischi di esfiltrazione di dati. Quando i Controlli di servizio VPC sono configurati, l'agente di cui è stato eseguito il deployment mantiene l'accesso sicuro alle API di Google e ai servizi, come l'API BigQuery, l'API Cloud SQL Admin e l'API Agent Platform, verificando il funzionamento senza problemi all'interno del perimetro definito. Fondamentalmente, i Controlli di servizio VPC bloccano efficacemente tutto l'accesso a internet pubblico, limitando il movimento dei dati ai confini della rete autorizzata e migliorando significativamente la postura di sicurezza aziendale.
I Controlli di servizio VPC non sono supportati con Agent Gateway. Tuttavia, puoi utilizzare i vincoli personalizzati dei criteri dell'organizzazione per limitare i gateway che possono essere associati ai tuoi agenti. Per saperne di più, vedi Instradare il traffico tramite Agent Gateway.
Interfaccia Private Service Connect: per Agent Runtime, PSC-I consente agli agenti di interagire con i servizi ospitati privatamente nel VPC di un utente. Per ulteriori informazioni, consulta Utilizzo dell'interfaccia Private Service Connect con Agent Runtime.
Chiavi di crittografia gestite dal cliente (CMEK): Agent Runtime supporta CMEK per proteggere i tuoi dati con le tue chiavi di crittografia, che ti danno la proprietà e il controllo completo delle chiavi che proteggono i tuoi dati at-rest in Google Cloud. Per saperne di più, consulta CMEK di Agent Runtime.
Residenza dei dati (DRZ): Agent Runtime supporta la residenza dei dati (DRZ) per garantire che tutti i dati at-rest vengano archiviati all'interno della regione specificata.
HIPAA: nell'ambito della piattaforma agentica, Agent Runtime supporta i carichi di lavoro HIPAA.
Access Transparency: Access Transparency ti fornisce log che acquisiscono le azioni intraprese dal personale di Google quando accede ai tuoi contenuti. Per ulteriori informazioni su come abilitare Access Transparency per Agent Runtime, vedi Access Transparency in Agent Platform.
La tabella seguente mostra quali funzionalità di sicurezza aziendale sono supportate per ogni servizio della piattaforma dell'agente:
| Funzionalità di sicurezza | Agent Runtime | Sessioni | Memory Bank | Example Store | esegui il codice |
|---|---|---|---|---|---|
| Controlli di servizio VPC | Sì | Sì | Sì | No | Sì |
| Chiavi di crittografia gestite dal cliente | Sì | Sì | Sì | No | Sì |
| Residenza dei dati (DRZ) a riposo | Sì | Sì | Sì | No | Sì |
| HIPAA | Sì | Sì | Sì | Sì | Sì |
| Access Transparency | Sì | Sì | Sì | No | No |
| Approvazione accesso | Sì | Sì | Sì | No | No |
Aree geografiche supportate
Consulta Località per un elenco delle regioni supportate per Agent Runtime.
Quota
Consulta Quote e limiti di sistema per informazioni sulle quote di Agent Runtime.
Prezzi
È disponibile un livello senza costi per Agent Runtime. Per informazioni sui prezzi di Agent Runtime, consulta la pagina Prezzi di Gemini Enterprise Agent Platform.
Migrazione all'SDK basato sul client
Il modulo agent_engines all'interno dell'SDK Agent Platform viene sottoposto a refactoring per un design basato sul client per i seguenti motivi principali:
- Per allinearsi all'Agent Development Kit (ADK) e a SDK Google Gen AI nelle rappresentazioni dei tipi canonici. Ciò garantisce un modo coerente e standardizzato di rappresentare i tipi di dati nei diversi SDK, il che semplifica l'interoperabilità e riduce l'overhead di conversione.
- Per la definizione dell'ambito a livello di cliente dei parametri Google Cloud nelle applicazioni multiprogetto e multisede. Ciò consente a un'applicazione di gestire le interazioni con le risorse in diversi Google Cloud progetti e località geografiche configurando ogni istanza client con le impostazioni specifiche di progetto e località.
- Per migliorare la rilevabilità e la coesione dei servizi di runtime dell'agente
Passaggi successivi
Configurazione di Agent Platform Runtime
Configura l'ambiente per utilizzare Agent Platform Runtime.