Questo documento descrive un'architettura di alto livello per un'applicazione che genera e amministra un quiz di apprendimento interattivo con un flusso di lavoro di AI basato su agenti. L'agente valuta le conoscenze di un utente su un argomento specifico e utilizza uno stato della sessione persistente e una memoria a lungo termine per creare un'esperienza personalizzata. L'agente mantiene una cronologia delle risposte dell'utente, il che gli consente di adattare dinamicamente la difficoltà e i contenuti delle domande successive.
Il pubblico di destinazione di questo documento include architetti, sviluppatori e amministratori che creano e gestiscono applicazioni di AI agentica. Questa architettura è adattabile per la creazione di applicazioni didattiche interattive e stateful in vari settori. Il documento presuppone una conoscenza di base dei sistemi di agenti AI. Per informazioni su come gli agenti si differenziano dai sistemi non agentici, vedi Qual è la differenza tra agenti AI, assistenti AI e bot?
La sezione Deployment di questo documento fornisce link a esempi di codice per aiutarti a sperimentare il deployment di un'applicazione di AI con agenti che esegue un flusso di lavoro di data science.
Architettura
Il seguente diagramma mostra un'architettura di alto livello per un agente di apprendimento interattivo.
L'architettura mostra il seguente flusso di dati:
- Un utente esegue un'azione, ad esempio inizia un quiz o invia una risposta, all'interno dell'applicazione per i quiz ospitata su Cloud Run.
- L'applicazione inoltra l'input dell'utente all'agente AI.
L'agente AI utilizza il modello Gemini su Vertex AI per interpretare l'input dell'utente. In base alla richiesta dell'utente, l'agente chiama gli strumenti appropriati per eseguire l'azione del quiz richiesta.
Ad esempio, l'agente seleziona uno strumento per avviare una sessione di quiz, valutare una risposta o generare la domanda successiva.
L'agente invia la risposta all'applicazione del quiz.
L'applicazione del quiz inoltra la risposta all'utente.
Per mantenere lo stato del quiz e personalizzare l'esperienza, l'agente esegue le seguenti attività in background:
- L'agente aggiunge i progressi e il punteggio più recenti del quiz alla cronologia della sessione salvata archiviata in Vertex AI Agent Engine Sessions.
- L'agente trasforma i dati del quiz in ricordi e li memorizza in Memory Bank per il recupero a lungo termine. L'agente utilizza i dati storici memorizzati per generare risposte sensibili al contesto nelle sessioni future.
Prodotti utilizzati
Questa architettura di esempio utilizza i seguenti prodotti Google Cloud :
- Cloud Run: una piattaforma di computing serverless che ti consente di eseguire container direttamente sull'infrastruttura scalabile di Google.
- Agent Development Kit (ADK): un insieme di strumenti e librerie per sviluppare, testare e distribuire agenti AI.
- Vertex AI: una piattaforma ML che ti consente di addestrare ed eseguire il deployment di modelli ML e applicazioni AI e personalizzare LLM da utilizzare in applicazioni basate sull'AI.
- Vertex AI Agent Engine Sessions: un servizio di archiviazione permanente che salva e recupera la cronologia delle interazioni tra un utente e gli agenti.
- Memory Bank: un servizio di archiviazione permanente che genera, perfeziona, gestisce e recupera ricordi a lungo termine in base alle conversazioni di un utente con un agente.
Deployment
Per eseguire il deployment di un'implementazione di esempio di questa architettura che fornisce quiz relativi alla programmazione, utilizza l'esempio di codice del tutor Python disponibile su GitHub.
Passaggi successivi
- (Notebook) Inizia a utilizzare Sessioni e Memory Bank per gli agenti ADK in Cloud Run.
- (Blog) Scopri di più su stato e memoria con ADK.
- (Codelab) Crea un assistente di revisione del codice AI di produzione con ADK.
- (Video) Guarda il podcast Agent Factory sulla memoria negli agenti.
- Scopri di più su come ospitare agenti AI su Cloud Run.
- Per una panoramica dei principi e dei consigli architetturali specifici per i workload di AI e ML in Google Cloud, consulta la prospettiva AI e ML nel Well-Architected Framework.
- Per ulteriori architetture di riferimento, diagrammi e best practice, esplora Cloud Architecture Center.
Collaboratori
Autore: Samantha He | Technical Writer
Altri collaboratori:
- Amina Mansour | Head of Cloud Platform Evaluations Team
- Kumar Dhanagopal | Sviluppatore di soluzioni cross-product
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Developer Relations Engineering Manager