智能体 AI 用例:实现数据科学工作流自动化

Last reviewed 2025-12-08 UTC

本文档介绍了一个应用的高级架构,该应用运行数据科学工作流以自动执行复杂的数据分析和机器学习任务。

此架构使用托管在 BigQuery 或 AlloyDB for PostgreSQL 中的数据集。该架构是一个多智能体系统,可让用户以自然语言命令运行操作,并且无需编写复杂的 SQL 或 Python 代码。

本文档的目标受众群体包括构建和管理智能体 AI 应用的架构师、开发者和管理员。借助此架构,业务团队和数据团队可以分析零售、金融和制造等各种行业的指标。本文档假定读者对智能体 AI 系统有基本的了解。如需了解智能体与非智能体系统的区别,请参阅 “AI 智能体、AI 助理和聊天机器人有什么区别?”

本文档的部署部分提供了指向代码 示例的链接,可帮助您尝试部署运行数据科学工作流的智能体 AI 应用。

架构

下图展示了数据科学工作流智能体的架构。

数据科学工作流代理的架构。

此架构包含以下组件:

组件 说明
前端 用户通过前端(例如以无服务器 Cloud Run 服务形式运行的聊天界面)与多智能体系统互动。
智能体 此架构使用以下智能体:
  • 根智能体协调器智能体,用于接收来自前端服务的请求。根智能体会解读用户请求,并尝试自行解决请求。如果任务需要 专用工具,根智能体会将请求委托给相应的 专用智能体。
  • 专用智能体:根 智能体使用“智能体即工具”功能调用以下专用智能体。
    • 分析智能体:用于数据 分析和可视化的专用智能体。分析智能体使用 AI 模型来 生成并运行 Python 代码,以处理数据集、创建图表和 执行统计分析。
    • AlloyDB for PostgreSQL 智能体:用于与 AlloyDB for PostgreSQL 中的数据互动的专用 智能体。该智能体 使用 AI 模型解读用户请求,并生成 以 PostgreSQL 方言生成 SQL。该智能体使用 MCP Toolbox for Databases 安全地连接到 数据库,然后运行 查询以检索请求的数据。
    • BigQuery 智能体:用于与 BigQuery 中的数据互动的专用 智能体。该智能体使用 AI 模型解读用户请求并生成 GoogleSQL 查询。该智能体使用 智能体开发套件 (ADK) 的内置 BigQuery 工具连接到数据库,然后运行查询以检索请求的数据。
  • BigQuery ML 智能体:根 智能体的子智能体,专门用于机器学习工作流。该智能体与 BigQuery ML 互动,以管理端到端机器学习生命周期。该智能体可以根据用户请求创建和训练模型、运行 评估以及生成预测。
智能体运行时 此架构中的 AI 智能体以 无服务器 Cloud Run 服务的形式部署
ADK ADK 提供 用于开发、测试和部署智能体的工具和框架。ADK 抽象了智能体创建的复杂性,让 AI 开发者可以专注于 智能体的逻辑和功能。
AI 模型和模型运行时 对于推理服务,此示例架构中的智能体 使用 Vertex AI 上的最新 Gemini 模型

使用的产品

此示例架构使用以下 Google Cloud 开源 产品和工具:

部署

如需部署此架构的示例实现,请使用 Data Science with Multiple Agents。该代码库提供了两个示例数据集来演示系统的灵活性,包括用于运营分析的航班数据集和用于业务分析的电子商务销售数据集。

后续步骤

贡献者

作者:Samantha He | 技术文档工程师

其他贡献者: