Ce document décrit une architecture de haut niveau pour une application qui génère et administre un quiz d'apprentissage interactif avec un workflow d'IA agentif. L'agent évalue les connaissances d'un utilisateur sur un sujet spécifique. Il utilise un état de session persistant et une mémoire à long terme pour créer une expérience personnalisée. L'agent conserve un historique des réponses de l'utilisateur, ce qui lui permet d'ajuster dynamiquement la difficulté et le contenu des questions suivantes.
Ce document s'adresse aux architectes, aux développeurs et aux administrateurs qui créent et gèrent des applications d'IA agentique. Cette architecture est adaptable pour créer des applications éducatives interactives et avec état dans divers secteurs. Ce document suppose que vous avez des connaissances de base sur les systèmes d'agents d'IA. Pour en savoir plus sur la différence entre les agents et les systèmes non agentiques, consultez Quelle est la différence entre les agents IA, les assistants IA et les bots ?
La section Déploiement de ce document fournit des liens vers des exemples de code pour vous aider à tester le déploiement d'une application d'IA agentique qui exécute un workflow de science des données.
Architecture
Le diagramme suivant illustre une architecture de haut niveau pour un agent d'apprentissage interactif.
L'architecture présente le flux de données suivant :
- Un utilisateur effectue une action, comme démarrer un quiz ou envoyer une réponse, dans l'application de quiz hébergée sur Cloud Run.
- L'application transmet la saisie de l'utilisateur à l'agent d'IA.
L'agent d'IA utilise le modèle Gemini sur Gemini Enterprise Agent Platform pour interpréter la saisie de l'utilisateur. En fonction de la demande de l'utilisateur, l'agent appelle les outils appropriés pour effectuer l'action demandée concernant le quiz.
Par exemple, l'agent sélectionne un outil pour démarrer une session de quiz, évaluer une réponse ou générer la question suivante.
L'agent envoie la réponse à l'application de quiz.
L'application de quiz transmet la réponse à l'utilisateur.
Pour maintenir l'état du quiz et personnaliser l'expérience, l'agent effectue les tâches en arrière-plan suivantes :
- L'application d'agent ajoute la progression et le score les plus récents du quiz à l'historique de la session enregistrée stockée dans Gemini Enterprise Agent Platform Sessions.
- L'agent transforme les données du quiz en souvenirs et les stocke dans Memory Bank pour une récupération à long terme. L'agent utilise les données historiques stockées en mémoire pour générer des réponses contextuelles lors des prochaines sessions.
Produits utilisés
Cette architecture d'exemple utilise les produits Google Cloud suivants :
- Cloud Run : plate-forme de calcul gérée qui vous permet d'exécuter des conteneurs directement sur l'infrastructure évolutive de Google.
- Agent Development Kit (ADK) : ensemble d'outils et de bibliothèques permettant de développer, de tester et de déployer des agents IA.
- Gemini Enterprise Agent Platform : une plate-forme complète qui vous permet de créer, de faire évoluer, de gérer et d'optimiser des agents IA de niveau entreprise.
- Sessions de la plate-forme Gemini Enterprise Agent : service de stockage persistant qui enregistre et récupère l'historique des interactions entre un utilisateur et les agents.
- Memory Bank : service de stockage persistant qui génère, affine, gère et récupère les souvenirs à long terme en fonction des conversations d'un utilisateur avec un agent.
Déploiement
Pour déployer un exemple d'implémentation de cette architecture qui propose des quiz sur le codage, utilisez l'exemple de code Python pour le tutoriel disponible sur GitHub.
Étapes suivantes
- (Notebook) Premiers pas avec les sessions et Memory Bank pour les agents ADK dans Cloud Run
- (Blog) En savoir plus sur l'état et la mémoire avec ADK
- (Atelier de programmation) Créer un assistant de revue de code IA de production avec ADK
- (Vidéo) Regardez le podcast Agent Factory sur la mémoire dans les agents.
- Découvrez comment héberger des agents d'IA sur Cloud Run.
- Pour obtenir une présentation des principes et des recommandations d'architecture spécifiques aux charges de travail d'IA et de ML dans Google Cloud, consultez la perspective de l'IA et du ML dans le framework Well-Architected.
- Pour découvrir d'autres architectures de référence, schémas et bonnes pratiques, consultez le Centre d'architecture cloud.
Contributeurs
Auteur : Samantha He | Rédactrice technique
Autres contributeurs :
- Amina Mansour | Cadre chez Cloud Platform Evaluations
- Kumar Dhanagopal Développeur de solutions multiproduits
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Responsable de l'ingénierie des relations avec les développeurs