Questo documento fornisce un'architettura di alto livello per un sistema di AI agentica per orchestrare le interazioni con sistemi aziendali disparati. Un agente orchestratore automatizza processi complessi e unifica l'accesso a più sistemi aziendali tramite interfacce moderne e conversazionali. Questi sistemi potrebbero essere applicazioni commerciali di terze parti o sistemi interni proprietari. Questo approccio di progettazione elimina le integrazioni di sistemi point-to-point, in modo che gli operatori possano evitare il cambio di contesto costante (elaborazione swivel-chair).
Il pubblico di destinazione di questo documento include architetti, sviluppatori e amministratori che creano e gestiscono applicazioni di AI agentica nel cloud. Il documento presuppone che tu abbia una conoscenza di base dell'AI agentica.
Architettura
Il seguente diagramma mostra un'architettura a più livelli in cui un agente orchestratore utilizza l'AI per indirizzare le interazioni dei clienti da più canali ai sistemi di backend appropriati.
I componenti dell'architettura sono organizzati nei seguenti livelli:
| incorporato | Componenti |
|---|---|
| Canali di interazione | Nell'architettura di esempio, i client interagiscono con il sistema di AI agentica tramite i seguenti canali multipli:
|
| Core agentico | Il componente principale dell'architettura è un agente orchestratore creato utilizzando Agent Development Kit (ADK) e di cui è stato eseguito il deployment su Cloud Run. L'agente di orchestrazione gestisce un sistema multi-agente. Questa piattaforma serverless offre scalabilità e controllo dell'accesso utilizzando Identity and Access Management (IAM) per l'API REST dell'agente. Per mantenere lo stato nelle attività in più passaggi, l'agente utilizza il supporto ADK integrato per rendere persistenti i dati di stato in Vertex AI Session Service o Cloud Storage. |
| Integrazione standardizzata con i sistemi di backend | Per la comunicazione tra l'agente e i sistemi di backend, l'architettura utilizza server Model Context Protocol (MCP) distribuiti su Cloud Run.
Ogni server MCP espone l'API di un sistema di backend specifico come un insieme standardizzato di strumenti. I server MCP formano un livello anticorruzione che isola l'agente dai sistemi di backend. Questo approccio aiuta a evitare l'accoppiamento stretto dell'agente con i sistemi di backend. Semplifica la logica dell'agente e ti consente di modernizzare i sistemi di backend indipendentemente dall'agente. |
| Sistemi di backend | Nell'architettura di esempio, l'agente AI coordina l'accesso ai seguenti sistemi di backend:
|
Prodotti utilizzati
Questa architettura di esempio utilizza i seguenti prodotti Google Cloud :
- Vertex AI: una piattaforma ML che ti consente di addestrare ed eseguire il deployment di modelli ML e applicazioni AI e personalizzare LLM da utilizzare in applicazioni basate sull'AI.
- Cloud Run: una piattaforma di computing serverless che ti consente di eseguire container direttamente sull'infrastruttura scalabile di Google.
- Pub/Sub: un servizio di messaggistica asincrono e scalabile che disaccoppia i servizi che producono messaggi da quelli che li elaborano.
- Gemini Enterprise: una piattaforma sicura completamente gestita per eseguire il deployment e gestire agenti AI all'interno di un'azienda.
- Gemini: una famiglia di modelli di AI multimodale sviluppati da Google.
- Cloud Storage: uno spazio di archiviazione di oggetti a basso costo e senza limiti per diversi tipi di dati. I dati sono accessibili dall'interno e dall'esterno di Google Cloude vengono replicati in più località per la ridondanza.
- Cloud SQL: un servizio di database relazionale completamente gestito che ti aiuta a eseguire il provisioning, il funzionamento e la gestione dei database MySQL, PostgreSQL e SQL Server su Google Cloud.
Casi d'uso
Questa architettura è utile per i seguenti casi d'uso:
- Automatizza l'elaborazione swivel-chair tra applicazioni esterne e interne disparate.
- Crea un'interfaccia unificata per più sistemi legacy senza una migrazione su larga scala.
- Aggiungi funzionalità intelligenti e conversazionali ai processi aziendali esistenti.
- Modernizza in modo incrementale le tue applicazioni con funzionalità basate sugli eventi.
L'architettura offre i seguenti vantaggi:
- Produttività: automatizza le attività ripetitive per ridurre l'errore umano, in modo che i tuoi team possano concentrarsi su attività a valore aggiunto.
- Scalabilità: utilizza un approccio basato sugli eventi per sviluppare, implementare e scalare i servizi in modo indipendente.
- Esperienza utente migliorata: crea interfacce moderne e flessibili per integrare processi aziendali complessi.
- Integrazione a prova di futuro: standardizza l'integrazione con i sistemi di backend utilizzando i server MCP, in modo da poter sostituire e aggiornare i sistemi di backend in modo indipendente.
Considerazioni sulla progettazione
Per implementare questa architettura per la produzione, tieni presente i seguenti consigli:
- Sicurezza: per i servizi Cloud Run, utilizza service account IAM dedicati con autorizzazioni basate sul principio del privilegio minimo. Proteggi l'API dell'agente configurando i controlli in entrata di Cloud Run per limitare l'accesso ai chiamanti autenticati.
- Osservabilità: nei sistemi distribuiti, la registrazione e il tracciamento sono fondamentali per la risoluzione dei problemi. Per ottenere visibilità sull'intero flusso di lavoro dell'agente, strumenta i tuoi servizi per scrivere log strutturati in Cloud Logging ed emettere tracce in Cloud Trace.
- Prestazioni: Cloud Run esegue automaticamente lo scale up in base alla domanda e lo scale down fino a zero quando non c'è carico. Per le applicazioni sensibili alla latenza, puoi ridurre al minimo gli avvii a freddo configurando un numero minimo di istanze.
- Automazione del deployment: automatizza il provisioning e la gestione delle risorse utilizzando uno strumento Infrastructure as Code (IaC) come Terraform. IaC contribuisce a garantire deployment ripetibili e controllabili in fase di sviluppo, staging e produzione.
- Governance: semplifica la progettazione e l'implementazione dell'infrastruttura della tua applicazione utilizzando App Design Center. Puoi utilizzare App Design Center per definire modelli che incorporano regole di governance e best practice per la tua organizzazione.
Passaggi successivi
- (Codelab) Esegui il deployment di un server MCP sicuro su Cloud Run.
- (Codelab) Crea ed esegui il deployment di un agente che utilizza un server MCP su Cloud Run.
- (Codelab) Richiamare in modo asincrono un'applicazione di AI agentica utilizzando gli eventi.
- (Corso Google Skills) Crea agenti intelligenti con ADK.
- (Esempi di codice) Scopri altri esempi di codice su GitHub per creare agenti con ADK.
- Per una panoramica dei principi e dei consigli architetturali specifici per i workload di AI e ML in Google Cloud, consulta la prospettiva AI e ML nel Well-Architected Framework.
Collaboratori
Autore: Casey West | Architecture Advocate, Google Cloud
Altri collaboratori:
- Amina Mansour | Head of Cloud Platform Evaluations Team
- Kumar Dhanagopal | Sviluppatore di soluzioni cross-product
- Leonid Yankulin | Developer Relations Engineer