Caso d'uso dell'AI agentica: orchestrare l'accesso a sistemi aziendali disparati

Last reviewed 2025-12-03 UTC

Questo documento fornisce un'architettura di alto livello per un sistema di AI agentica per orchestrare le interazioni con sistemi aziendali disparati. Un agente orchestratore automatizza processi complessi e unifica l'accesso a più sistemi aziendali tramite interfacce moderne e conversazionali. Questi sistemi potrebbero essere applicazioni commerciali di terze parti o sistemi interni proprietari. Questo approccio di progettazione elimina le integrazioni di sistemi point-to-point, in modo che gli operatori possano evitare il cambio di contesto costante (elaborazione con rotazione della sedia).

Il pubblico di destinazione di questo documento include architetti, sviluppatori e amministratori che creano e gestiscono applicazioni di AI agentica nel cloud. Il documento presuppone che tu abbia una conoscenza di base dell'AI agentica.

Architettura

Il seguente diagramma mostra un'architettura multilivello in cui un agente orchestratore utilizza l'AI per indirizzare le interazioni dei clienti da più canali ai sistemi di backend appropriati.

Architettura per un'applicazione di AI con agenti che orchestra l'accesso a sistemi aziendali diversi.

I componenti dell'architettura sono organizzati nei seguenti livelli:

incorporato	Componenti
Canali di interazione	Nell'architettura di esempio, i client interagiscono con il sistema di AI agentica tramite i seguenti canali multipli: Un frontend personalizzato, ad esempio un'applicazione web che comunica con l'agente tramite un'API REST sicura e supporta processi human-in-the-loop. Un'interfaccia di chat ad hoc su Gemini Enterprise che richiama l'agente come strumento sicuro e consente agli utenti di interagire con sistemi di backend complessi utilizzando il linguaggio naturale. Un'applicazione esterna che avvia flussi di lavoro di automazione da sistema a sistema pubblicando eventi aziendali in un argomento Pub/Sub.
Funzionalità agentiche di base	Il componente principale dell'architettura è un agente orchestratore creato utilizzando Agent Development Kit (ADK) e di cui è stato eseguito il deployment su Cloud Run. L'agente di orchestrazione gestisce un sistema multi-agente. Questa piattaforma serverless offre scalabilità e controllo dell'accesso utilizzando Identity and Access Management (IAM) per l'API REST dell'agente. Per mantenere lo stato nelle attività in più passaggi, l'agente utilizza il supporto ADK integrato per rendere persistenti i dati di stato in Vertex AI Session Service o Cloud Storage.
Integrazione standardizzata con i sistemi di backend	Per la comunicazione tra l'agente e i sistemi di backend, l'architettura utilizza server Model Context Protocol (MCP) distribuiti su Cloud Run. MCP Toolbox for Databases fornisce un insieme di strumenti sicuri e pronti all'uso per l'accesso a database come Cloud SQL. I server MCP personalizzati forniscono l'accesso alle applicazioni di backend. Ogni server MCP espone l'API di un sistema di backend specifico come un insieme standardizzato di strumenti. I server MCP formano un livello anticorruzione che isola l'agente dai sistemi di backend. Questo approccio consente di evitare l'accoppiamento stretto dell'agente con i sistemi di backend. Semplifica la logica dell'agente e consente di modernizzare i sistemi di backend indipendentemente dall'agente.
Sistemi di backend	Nell'architettura di esempio, l'agente AI coordina l'accesso ai seguenti sistemi di backend: Un database operativo in Cloud SQL. Un'applicazione di cui è stato eseguito il deployment sulle VM di Compute Engine. Un'applicazione che viene eseguita al di fuori di Google Cloud.

Prodotti utilizzati

Questa architettura di esempio utilizza i seguenti prodotti Google Cloud :

Vertex AI: una piattaforma ML che ti consente di addestrare ed eseguire il deployment di modelli ML e applicazioni AI e personalizzare LLM da utilizzare in applicazioni basate sull'AI.
Cloud Run: una piattaforma di computing serverless che ti consente di eseguire container direttamente sull'infrastruttura scalabile di Google.
Pub/Sub: un servizio di messaggistica asincrono e scalabile che disaccoppia i servizi che producono messaggi da quelli che li elaborano.
Gemini Enterprise: una piattaforma sicura completamente gestita per eseguire il deployment e gestire agenti AI all'interno di un'azienda.
Gemini : una famiglia di modelli di AI multimodale sviluppati da Google.

Cloud Storage: uno spazio di archiviazione di oggetti a basso costo e senza limiti per diversi tipi di dati. I dati sono accessibili dall'interno e dall'esterno di Google Cloude vengono replicati in più località per la ridondanza.
Cloud SQL: un servizio di database relazionale completamente gestito che ti aiuta a eseguire il provisioning, il funzionamento e la gestione dei database MySQL, PostgreSQL e SQL Server su Google Cloud.

Casi d'uso

Questa architettura è utile per i seguenti casi d'uso:

Automatizza l'elaborazione di swivel-chair tra applicazioni esterne e interne disparate.
Crea un'interfaccia unificata per più sistemi legacy senza una migrazione su larga scala.
Aggiungi funzionalità intelligenti e conversazionali ai processi aziendali esistenti.
Modernizza in modo incrementale le tue applicazioni con funzionalità basate sugli eventi.

L'architettura offre i seguenti vantaggi:

Produttività: automatizza le attività ripetitive per ridurre l'errore umano, in modo che i tuoi team possano concentrarsi su attività a valore aggiunto.
Scalabilità: utilizza un approccio basato su eventi per sviluppare, eseguire il deployment e scalare i servizi in modo indipendente.
Esperienza utente migliorata: crea interfacce moderne e flessibili per integrare processi aziendali complessi.
Integrazione a prova di futuro: standardizza l'integrazione con i sistemi di backend utilizzando i server MCP, in modo da poter sostituire e aggiornare i sistemi di backend in modo indipendente.

Considerazioni sulla progettazione

Per implementare questa architettura per la produzione, tieni presente i seguenti consigli:

Sicurezza: per i servizi Cloud Run, utilizza service account IAM dedicati con autorizzazioni basate sul principio del privilegio minimo. Proteggi l'API dell'agente configurando i controlli in entrata di Cloud Run per limitare l'accesso ai chiamanti autenticati.
Osservabilità: nei sistemi distribuiti, la registrazione e il tracciamento sono fondamentali per la risoluzione dei problemi. Per ottenere visibilità sull'intero flusso di lavoro dell'agente, strumenta i tuoi servizi per scrivere log strutturati in Cloud Logging ed emettere tracce in Cloud Trace.
Prestazioni: Cloud Run esegue automaticamente lo scale up in base alla domanda e lo scale down fino a zero quando non c'è carico. Per le applicazioni sensibili alla latenza, puoi ridurre al minimo gli avvii a freddo configurando un numero minimo di istanze.
Automazione del deployment: automatizza il provisioning e la gestione delle risorse utilizzando uno strumento Infrastructure as Code (IaC) come Terraform. IaC contribuisce a garantire deployment ripetibili e controllabili in fase di sviluppo, staging e produzione.
Governance: semplifica la progettazione e l'implementazione dell'infrastruttura della tua applicazione utilizzando App Design Center. Puoi utilizzare App Design Center per definire modelli che incorporano regole di governance e best practice per la tua organizzazione.

Passaggi successivi

(Codelab) Esegui il deployment di un server MCP sicuro su Cloud Run.
(Codelab) Crea ed esegui il deployment di un agente che utilizza un server MCP su Cloud Run.
(Codelab) Richiamare in modo asincrono un'applicazione di AI agentica utilizzando gli eventi.
(Corso Google Skills) Crea agenti intelligenti con ADK.
(Esempi di codice) Scopri altri esempi di codice in GitHub per creare agenti con ADK.
Per una panoramica dei principi e dei consigli architetturali specifici per i workload di AI e ML in Google Cloud, consulta la prospettiva AI e ML nel Well-Architected Framework.

Collaboratori

Autore: Casey West | Architecture Advocate, Google Cloud

Altri collaboratori:

Amina Mansour | Head of Cloud Platform Evaluations Team
Kumar Dhanagopal | Sviluppatore di soluzioni cross-product
Leonid Yankulin | Developer Relations Engineer

Caso d'uso dell'AI agentica: orchestrare l'accesso a sistemi aziendali disparati Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.