En este documento, se describe una arquitectura de alto nivel para una aplicación que genera y administra un cuestionario de aprendizaje interactivo con un flujo de trabajo de IA agente. El agente evalúa el conocimiento de un usuario sobre un tema específico y usa un estado de sesión persistente y una memoria a largo plazo para crear una experiencia personalizada. El agente mantiene un historial de las respuestas del usuario, lo que le permite ajustar de forma dinámica la dificultad y el contenido de las preguntas posteriores.
El público previsto para este documento incluye arquitectos, desarrolladores y administradores que crean y administran aplicaciones de IA de agentes. Esta arquitectura se puede adaptar para crear aplicaciones educativas interactivas y con estado en varias industrias. En el documento, se supone que tienes conocimientos básicos de los sistemas de agentes de IA. Si quieres obtener información sobre cómo difieren los agentes de los sistemas no agentes , consulta ¿Cuál es la diferencia entre agentes de IA, asistentes de IA y bots?
En la sección de implementación de este documento, se proporcionan vínculos a muestras de código para ayudarte a experimentar con la implementación de una aplicación de IA de agentes que ejecuta un flujo de trabajo de ciencia de datos.
Arquitectura
En el siguiente diagrama, se muestra una arquitectura de alto nivel para un agente de aprendizaje interactivo.
La arquitectura muestra el siguiente flujo de datos:
- Un usuario realiza una acción, como iniciar un cuestionario o enviar una respuesta, en la aplicación de cuestionario alojada en Cloud Run.
- La aplicación reenvía la entrada del usuario al agente de IA.
El agente de IA usa el modelo de Gemini en Gemini Enterprise Agent Platform para interpretar la entrada del usuario. Según la solicitud del usuario, el agente llama a las herramientas adecuadas para realizar la acción de cuestionario solicitada.
Por ejemplo, el agente selecciona una herramienta para iniciar una sesión de cuestionario, evaluar una respuesta o generar la siguiente pregunta.
El agente envía la respuesta a la aplicación de cuestionario.
La aplicación de cuestionario reenvía la respuesta al usuario.
Para mantener el estado del cuestionario y personalizar la experiencia, el agente realiza las siguientes tareas en segundo plano:
- El agente agrega el progreso y la puntuación más recientes del cuestionario al historial de la sesión guardada que se almacena en las sesiones de Gemini Enterprise Agent Platform.
- El agente transforma los datos del cuestionario en memorias y los almacena en Memory Bank para recuperarlos a largo plazo. El agente usa los datos históricos almacenados en la memoria para generar respuestas contextuales en sesiones futuras.
Productos usados
En esta arquitectura de ejemplo, se usan los siguientes Google Cloud productos:
- Cloud Run: Una plataforma de procesamiento administrada que te permite ejecutar contenedores directamente sobre la infraestructura escalable de Google.
- Kit de desarrollo de agentes (ADK): Es un conjunto de herramientas y bibliotecas para desarrollar, probar e implementar agentes de IA.
- Gemini Enterprise Agent Platform: Es una plataforma integral que te permite crear, escalar, administrar y optimizar agentes de IA de nivel empresarial.
- Sesiones de Gemini Enterprise Agent Platform: Es un servicio de almacenamiento persistente que guarda y recupera el historial de interacciones entre un usuario y los agentes.
- Memory Bank: Es un servicio de almacenamiento persistente que genera, refina, administra y recupera memorias a largo plazo basadas en las conversaciones de un usuario con un agente.
Deployment
Para implementar una implementación de muestra de esta arquitectura que proporciona cuestionarios relacionados con la codificación, usa la muestra de código de tutor de Python que está disponible en GitHub.
¿Qué sigue?
- (Notebook) Comienza a usar Sessions y Memory Bank para agentes de ADK en Cloud Run.
- (Blog) Obtén más información sobre el estado y la memoria con el ADK.
- (Codelab) Crea un asistente de revisión de código de IA de producción con el ADK.
- (Video) Mira el podcast The Agent Factory sobre la memoria en los agentes.
- Obtén información para alojar agentes de IA en Cloud Run.
- Para obtener una descripción general de los principios y las recomendaciones de la arquitectura que son específicos de las cargas de trabajo de IA y AA en Google Cloud, consulta la perspectiva de IA y AA en Well-Architected Framework.
- Para obtener más información sobre las arquitecturas de referencia, los diagramas y las prácticas recomendadas, explora el Cloud Architecture Center.
Colaboradores
Autor: Samantha He | Escritora técnica
Otros colaboradores:
- Amina Mansour | Jefa del equipo de evaluaciones de Cloud Platform
- Kumar Dhanagopal | Desarrollador de soluciones entre productos
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Administrador de ingeniería de relaciones con desarrolladores