本文档介绍了一种应用的概要架构,该应用可运行数据科学工作流来自动执行复杂的数据分析和机器学习任务。
此架构使用托管在 BigQuery 或 AlloyDB for PostgreSQL 中的数据集。该架构是一个多代理系统,可让用户通过自然语言命令运行操作,无需编写复杂的 SQL 或 Python 代码。
本文档的目标受众群体包括构建和管理智能体 AI 应用的架构师、开发者和管理员。借助此架构,业务团队和数据团队可以分析零售、金融和制造等各种行业的指标。本文档假定您对智能体 AI 系统有基本的了解。如需了解智能体与非智能体系统的区别,请参阅 AI 智能体、AI 助理和聊天机器人有什么区别?
本文档的部署部分提供了指向代码示例的链接,可帮助您尝试部署运行数据科学工作流的代理型 AI 应用。
架构
下图展示了数据科学工作流代理的架构。
此架构包括以下组件:
| 组件 | 说明 |
|---|---|
| 前端 | 用户通过前端(例如作为无服务器 Cloud Run 服务运行的聊天界面)与多代理系统互动。 |
| 代理 | 此架构使用以下代理:
|
| 智能体运行时环境 | 此架构中的 AI 代理部署为无服务器 Cloud Run 服务。 |
| ADK | ADK 提供用于开发、测试和部署代理的工具和框架。ADK 可抽象化智能体创建的复杂性,让 AI 开发者专注于智能体的逻辑和功能。 |
| AI 模型和模型运行时 | 对于推理服务,此示例架构中的代理使用 Vertex AI 上的最新 Gemini 模型。 |
使用的产品
此示例架构使用以下 Google Cloud 和开源产品及工具:
- Cloud Run:一个无服务器计算平台,可让您直接在 Google 可伸缩的基础设施之上运行容器。
- 智能体开发套件 (ADK):一套用于开发、测试和部署 AI 智能体的工具和库。
- Vertex AI:一个机器学习平台,用于训练和部署机器学习模型和 AI 应用以及自定义 LLM,以在依托 AI 技术的应用中使用。
- Gemini:Google 开发的一系列多模态 AI 模型。
- BigQuery:一种企业数据仓库,可帮助您使用机器学习地理空间分析和商业智能等内置功能管理和分析数据。
- AlloyDB for PostgreSQL:与 PostgreSQL 兼容的全托管式数据库服务,专为要求苛刻的工作负载(包括混合事务和分析处理)而设计。
- MCP Toolbox for Databases:一款开源 Model Context Protocol (MCP) 服务器,可管理连接池、身份验证和可观测性等数据库复杂性,让 AI 智能体安全地连接到数据库。
部署
如需部署此架构的示例实现,请使用具有多个代理的数据科学。该代码库提供了两个示例数据集来展示系统的灵活性,包括用于运营分析的航班数据集和用于业务分析的电子商务销售数据集。
后续步骤
- (视频)观看有关数据工程和数据科学的 AI 智能体的 Agent Factory 播客。
- (笔记本)在 Colab Enterprise 中使用数据科学代理。
- 了解如何在 Cloud Run 上托管 AI 代理。
- 如需简要了解 Google Cloud中特定于 AI 和机器学习工作负载的架构原则和建议,请参阅 Well-Architected Framework 中的 AI 和机器学习视角。
- 如需查看更多参考架构、图表和最佳实践,请浏览 Cloud 架构中心。
贡献者
作者:Samantha He | 技术文档工程师
其他贡献者:
- Amina Mansour | Cloud Platform 评估团队负责人
- Kumar Dhanagopal | 跨产品解决方案开发者
- Megan O'Keefe | 开发技术推广工程师
- Rachael Deacon-Smith | 开发技术推广工程师
- Shir Meir Lador | 开发者关系工程经理