本文档介绍了应用的高层架构,该应用通过代理式 AI 工作流生成和管理交互式学习测验。代理会评估用户在特定主题方面的知识,并使用持久会话状态和长期记忆来打造个性化体验。该代理会保留用户的回答历史记录,以便动态调整后续问题的难度和内容。
本文档的目标受众群体包括构建和管理智能体 AI 应用的架构师、开发者和管理员。此架构可用于创建各种行业中的交互式有状态教育应用。本文档假定您对 AI 代理系统有基础了解。如需了解智能体与非智能体系统的区别,请参阅 AI 智能体、AI 助理和聊天机器人有什么区别?
本文档的部署部分提供了指向代码示例的链接,可帮助您尝试部署运行数据科学工作流程的代理型 AI 应用。
架构
下图展示了交互式学习代理的概要架构。
该架构展示了以下数据流:
- 用户在 Cloud Run 上托管的测验应用中执行操作,例如开始测验或提交答案。
- 应用将用户输入转发给 AI 代理。
AI 代理使用 Vertex AI 上的 Gemini 模型来解读用户输入。根据用户的请求,智能体调用相应的工具来执行所请求的测验操作。
例如,代理会选择一个工具来开始测验会话、评估答案或生成下一个问题。
代理将响应发送给测验应用。
测验应用将回答转发给用户。
为了保持测验的状态并提供个性化体验,代理会执行以下后台任务:
- 智能体将最新的测验进度和得分附加到存储在 Vertex AI Agent Engine 会话中的已保存会话的历史记录中。
- 代理会将测验数据转换为记忆,并将其存储在记忆库中,以便长期回忆。代理会使用存储在内存中的历史数据,在未来的会话中生成具有上下文感知能力的回答。
使用的产品
此示例架构使用以下 Google Cloud 产品:
- Cloud Run:一个无服务器计算平台,可让您直接在 Google 可伸缩的基础设施之上运行容器。
- 智能体开发套件 (ADK):一套用于开发、测试和部署 AI 智能体的工具和库。
- Vertex AI:一个机器学习平台,用于训练和部署机器学习模型和 AI 应用以及自定义 LLM,以在依托 AI 技术的应用中使用。
- Vertex AI Agent Engine 会话:一种持久性存储服务,用于保存和检索用户与智能体之间的互动历史记录。
- 记忆库:一种持久性存储服务,可根据用户与智能体的对话生成、优化、管理和检索长期记忆。
部署
如需部署提供与编码相关的测验的此架构的示例实现,请使用 GitHub 中提供的 Python tutor 代码示例。
后续步骤
- (笔记本)开始在 Cloud Run 中将 Vertex AI 会话和记忆库与 ADK 智能体搭配使用。
- (博文)详细了解 ADK 的状态和内存。
- (Codelab) 使用 ADK 构建生产环境 AI 代码审查助理。
- (视频)观看关于智能体记忆的 Agent Factory 播客。
- 了解在 Cloud Run 上托管 AI 代理。
- 如需简要了解 Google Cloud中特定于 AI 和机器学习工作负载的架构原则和建议,请参阅 Well-Architected Framework 中的 AI 和机器学习视角。
- 如需查看更多参考架构、图表和最佳实践,请浏览 Cloud 架构中心。
贡献者
作者:Samantha He | 技术文档工程师
其他贡献者:
- Amina Mansour | Cloud Platform 评估团队负责人
- Kumar Dhanagopal | 跨产品解决方案开发者
- Megan O'Keefe | 开发技术推广工程师
- Rachael Deacon-Smith | 开发技术推广工程师
- Shir Meir Lador | 开发者关系工程经理