Ce document décrit une architecture de haut niveau pour une application qui génère et administre un questionnaire d'apprentissage interactif avec un workflow d'IA agentique. L'agent évalue les connaissances d'un utilisateur sur un sujet spécifique. Il utilise un état de session persistant et une mémoire à long terme pour créer une expérience personnalisée. L'agent conserve un historique des réponses de l'utilisateur, ce qui lui permet d'ajuster dynamiquement la difficulté et le contenu des questions suivantes.
Ce document s'adresse aux architectes, aux développeurs et aux administrateurs qui créent et gèrent des applications d'IA agentique. Cette architecture est adaptable pour créer des applications éducatives interactives et avec état dans divers secteurs. Ce document suppose une compréhension de base des systèmes d'agents d'IA. Pour en savoir plus sur la différence entre les agents et les systèmes non agentiques , consultez Quelle est la différence entre les agents IA, les assistants IA et les bots ?
La section Déploiement de ce document fournit des liens vers des exemples de code pour vous aider à tester le déploiement d'une application d'IA agentique qui exécute un workflow de science des données.
Architecture
Le diagramme suivant présente une architecture de haut niveau pour un agent d'apprentissage interactif.
L'architecture présente le flux de données suivant :
- Un utilisateur effectue une action, par exemple démarrer un quiz ou envoyer une réponse, dans l'application de quiz hébergée sur Cloud Run.
- L'application transmet l'entrée de l'utilisateur à l'agent d'IA.
L'agent d'IA utilise le modèle Gemini sur Vertex AI pour interpréter l'entrée de l'utilisateur. En fonction de la requête de l'utilisateur, l'agent appelle les outils appropriés pour effectuer l'action de quiz demandée.
Par exemple, l'agent sélectionne un outil pour démarrer une session de quiz, évaluer une réponse ou générer la question suivante.
L'agent envoie la réponse à l'application de quiz.
L'application de quiz transmet la réponse à l'utilisateur.
Pour conserver l'état du quiz et personnaliser l'expérience, l'agent effectue les tâches en arrière-plan suivantes :
- L'agent ajoute la dernière progression et le dernier score du quiz à l'historique de la session enregistrée, stockée dans Vertex AI Agent Engine Sessions.
- L'agent transforme les données du quiz en souvenirs et les stocke dans Memory Bank pour une récupération à long terme. L'agent utilise les données historiques stockées en mémoire pour générer des réponses contextuelles lors de futures sessions.
Produits utilisés
Cet exemple d'architecture utilise les Google Cloud produits suivants :
- Cloud Run : plate-forme de calcul gérée qui vous permet d'exécuter des conteneurs directement sur l'infrastructure évolutive de Google.
- Agent Development Kit (ADK) : ensemble d'outils et de bibliothèques permettant de développer, de tester et de déployer des agents d'IA.
- Vertex AI : plate-forme de ML qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser les LLM à utiliser dans des applications basées sur l'IA.
- Vertex AI Agent Engine Sessions : service de stockage persistant qui enregistre et récupère l'historique des interactions entre un utilisateur et des agents.
- Memory Bank : service de stockage persistant qui génère, affine, gère et récupère des souvenirs à long terme en fonction des conversations d'un utilisateur avec un agent.
Déploiement
Pour déployer un exemple d'implémentation de cette architecture qui fournit des quiz liés au codage, utilisez l'exemple de code de tuteur Python disponible dans GitHub.
Étape suivante
- (Notebook) Premiers pas avec Sessions et Memory Bank pour les agents ADK dans Cloud Run.
- (Blog) En savoir plus sur l'état et la mémoire avec ADK.
- (Atelier de programmation) Créer un assistant de revue de code IA de production avec ADK.
- (Vidéo) Regarder le podcast The Agent Factory sur la mémoire dans les agents.
- En savoir plus sur l'hébergement d'agents d'IA sur Cloud Run.
- Pour obtenir une présentation des principes et recommandations d'architecture spécifiques aux charges de travail d'IA et de ML dans Google Cloud, consultez la section IA et ML du framework Well-Architected.
- Pour découvrir d'autres architectures de référence, schémas et bonnes pratiques, consultez le Cloud Architecture Center.
Contributeurs
Auteur : Samantha He | Rédactrice technique
Autres contributeurs :
- Amina Mansour | Responsable de l'équipe d'évaluation de Cloud Platform
- Kumar Dhanagopal | Développeur de solutions multiproduits
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Responsable de l'ingénierie des relations avec les développeurs