Caso d'uso dell'AI agentica: orchestrare l'accesso a sistemi aziendali disparati

Questo documento fornisce un'architettura di alto livello per un sistema di AI agentica per orchestrare le interazioni con sistemi aziendali disparati. Un agente orchestratore automatizza processi complessi e unifica l'accesso a più sistemi aziendali tramite interfacce moderne e conversazionali. Questi sistemi potrebbero essere applicazioni commerciali di terze parti o sistemi interni proprietari. Questo approccio di progettazione elimina le integrazioni di sistemi point-to-point, in modo che gli operatori possano evitare il cambio di contesto costante (elaborazione swivel-chair).

Il pubblico di destinazione di questo documento include architetti, sviluppatori e amministratori che creano e gestiscono applicazioni di AI agentica nel cloud. Il documento presuppone che tu abbia una conoscenza di base dell'AI agentica.

Architettura

Il seguente diagramma mostra un'architettura a più livelli in cui un agente orchestratore utilizza l'AI per indirizzare le interazioni dei clienti da più canali ai sistemi di backend appropriati.

Architettura per un'applicazione di AI con agenti che orchestra l'accesso a sistemi aziendali diversi. Architettura per un'applicazione di AI con agenti che orchestra l'accesso a sistemi aziendali diversi.

I componenti dell'architettura sono organizzati nei seguenti livelli:

incorporato Componenti
Canali di interazione

Nell'architettura di esempio, i client interagiscono con il sistema di AI agentica tramite i seguenti canali multipli:

  • Un frontend personalizzato, ad esempio un'applicazione web che comunica con l'agente tramite un'API REST sicura e supporta processi human-in-the-loop.
  • Un'interfaccia di chat ad hoc su Gemini Enterprise che richiama l'agente come strumento sicuro e consente agli utenti di interagire con sistemi di backend complessi utilizzando il linguaggio naturale.
  • Un'applicazione esterna che avvia flussi di lavoro di automazione da sistema a sistema pubblicando eventi aziendali in un argomento Pub/Sub.
Core agentico

Il componente principale dell'architettura è un agente orchestratore creato utilizzando Agent Development Kit (ADK) e di cui è stato eseguito il deployment su Cloud Run. L'agente di orchestrazione gestisce un sistema multi-agente. Questa piattaforma serverless offre scalabilità e controllo dell'accesso utilizzando Identity and Access Management (IAM) per l'API REST dell'agente.

Per mantenere lo stato nelle attività in più passaggi, l'agente utilizza il supporto ADK integrato per rendere persistenti i dati di stato in Vertex AI Session Service o Cloud Storage.

Integrazione standardizzata con i sistemi di backend

Per la comunicazione tra l'agente e i sistemi di backend, l'architettura utilizza server Model Context Protocol (MCP) distribuiti su Cloud Run.

  • MCP Toolbox for Databases fornisce un insieme di strumenti sicuri e pronti all'uso per l'accesso a database come Cloud SQL.
  • I server MCP personalizzati forniscono l'accesso alle applicazioni di backend.

Ogni server MCP espone l'API di un sistema di backend specifico come un insieme standardizzato di strumenti. I server MCP formano un livello anticorruzione che isola l'agente dai sistemi di backend. Questo approccio aiuta a evitare l'accoppiamento stretto dell'agente con i sistemi di backend. Semplifica la logica dell'agente e ti consente di modernizzare i sistemi di backend indipendentemente dall'agente.

Sistemi di backend

Nell'architettura di esempio, l'agente AI coordina l'accesso ai seguenti sistemi di backend:

  • Un database operativo in Cloud SQL.
  • Un'applicazione di cui è stato eseguito il deployment sulle VM di Compute Engine.
  • Un'applicazione che viene eseguita al di fuori di Google Cloud.

Prodotti utilizzati

Questa architettura di esempio utilizza i seguenti prodotti Google Cloud :

  • Vertex AI: una piattaforma ML che ti consente di addestrare ed eseguire il deployment di modelli ML e applicazioni AI e personalizzare LLM da utilizzare in applicazioni basate sull'AI.
  • Cloud Run: una piattaforma di computing serverless che ti consente di eseguire container direttamente sull'infrastruttura scalabile di Google.
  • Pub/Sub: un servizio di messaggistica asincrono e scalabile che disaccoppia i servizi che producono messaggi da quelli che li elaborano.
  • Gemini Enterprise: una piattaforma sicura completamente gestita per eseguire il deployment e gestire agenti AI all'interno di un'azienda.
  • Gemini: una famiglia di modelli di AI multimodale sviluppati da Google.
  • Cloud Storage: uno spazio di archiviazione di oggetti a basso costo e senza limiti per diversi tipi di dati. I dati sono accessibili dall'interno e dall'esterno di Google Cloude vengono replicati in più località per la ridondanza.
  • Cloud SQL: un servizio di database relazionale completamente gestito che ti aiuta a eseguire il provisioning, il funzionamento e la gestione dei database MySQL, PostgreSQL e SQL Server su Google Cloud.

Casi d'uso

Questa architettura è utile per i seguenti casi d'uso:

  • Automatizza l'elaborazione swivel-chair tra applicazioni esterne e interne disparate.
  • Crea un'interfaccia unificata per più sistemi legacy senza una migrazione su larga scala.
  • Aggiungi funzionalità intelligenti e conversazionali ai processi aziendali esistenti.
  • Modernizza in modo incrementale le tue applicazioni con funzionalità basate sugli eventi.

L'architettura offre i seguenti vantaggi:

  • Produttività: automatizza le attività ripetitive per ridurre l'errore umano, in modo che i tuoi team possano concentrarsi su attività a valore aggiunto.
  • Scalabilità: utilizza un approccio basato sugli eventi per sviluppare, implementare e scalare i servizi in modo indipendente.
  • Esperienza utente migliorata: crea interfacce moderne e flessibili per integrare processi aziendali complessi.
  • Integrazione a prova di futuro: standardizza l'integrazione con i sistemi di backend utilizzando i server MCP, in modo da poter sostituire e aggiornare i sistemi di backend in modo indipendente.

Considerazioni sulla progettazione

Per implementare questa architettura per la produzione, tieni presente i seguenti consigli:

  • Sicurezza: per i servizi Cloud Run, utilizza service account IAM dedicati con autorizzazioni basate sul principio del privilegio minimo. Proteggi l'API dell'agente configurando i controlli in entrata di Cloud Run per limitare l'accesso ai chiamanti autenticati.
  • Osservabilità: nei sistemi distribuiti, la registrazione e il tracciamento sono fondamentali per la risoluzione dei problemi. Per ottenere visibilità sull'intero flusso di lavoro dell'agente, strumenta i tuoi servizi per scrivere log strutturati in Cloud Logging ed emettere tracce in Cloud Trace.
  • Prestazioni: Cloud Run esegue automaticamente lo scale up in base alla domanda e lo scale down fino a zero quando non c'è carico. Per le applicazioni sensibili alla latenza, puoi ridurre al minimo gli avvii a freddo configurando un numero minimo di istanze.
  • Automazione del deployment: automatizza il provisioning e la gestione delle risorse utilizzando uno strumento Infrastructure as Code (IaC) come Terraform. IaC contribuisce a garantire deployment ripetibili e controllabili in fase di sviluppo, staging e produzione.
  • Governance: semplifica la progettazione e l'implementazione dell'infrastruttura della tua applicazione utilizzando App Design Center. Puoi utilizzare App Design Center per definire modelli che incorporano regole di governance e best practice per la tua organizzazione.

Passaggi successivi

Collaboratori

Autore: Casey West | Architecture Advocate, Google Cloud

Altri collaboratori: