智能体 AI 用例:实现数据科学工作流自动化

本文档介绍了一种应用的概要架构,该应用可运行数据科学工作流来自动执行复杂的数据分析和机器学习任务。

此架构使用托管在 BigQuery 或 AlloyDB for PostgreSQL 中的数据集。该架构是一个多代理系统,可让用户通过自然语言命令运行操作,无需编写复杂的 SQL 或 Python 代码。

本文档的目标受众群体包括构建和管理智能体 AI 应用的架构师、开发者和管理员。借助此架构,业务团队和数据团队可以分析零售、金融和制造等各种行业的指标。本文档假定您对智能体 AI 系统有基本的了解。如需了解智能体与非智能体系统的区别,请参阅 AI 智能体、AI 助理和聊天机器人有什么区别?

本文档的部署部分提供了指向代码示例的链接,可帮助您尝试部署运行数据科学工作流的代理型 AI 应用。

架构

下图展示了数据科学工作流代理的架构。

数据科学工作流代理的架构。

此架构包括以下组件:

组件 说明
前端 用户通过前端(例如作为无服务器 Cloud Run 服务运行的聊天界面)与多代理系统互动。
代理 此架构使用以下代理:
  • 根代理:一种协调器代理,用于接收来自前端服务的请求。根代理会解读用户请求,并尝试自行解决请求。如果任务需要专用工具,根代理会将请求委托给相应的专用代理。
  • 专业智能体:根智能体使用智能体即工具功能调用以下专业智能体。
    • 分析代理:一种专门用于数据分析和可视化的代理。分析代理使用 AI 模型生成并运行 Python 代码,以处理数据集、创建图表和执行统计分析。
    • AlloyDB for PostgreSQL 代理:一种专门用于与 AlloyDB for PostgreSQL 中的数据进行交互的代理。智能体使用 AI 模型来解读用户请求,并生成 PostgreSQL 方言的 SQL。智能体使用 MCP Toolbox for Databases 安全地连接到数据库,然后运行查询来检索所请求的数据。
    • BigQuery 智能体:一种专门用于与 BigQuery 中的数据互动的智能体。 智能体使用 AI 模型来解读用户请求并生成 GoogleSQL 查询。代理使用智能体开发套件 (ADK) 的内置 BigQuery 工具连接到数据库,然后运行查询以检索请求的数据。
  • BigQuery ML 代理:根代理的子代理,专门用于机器学习工作流。代理与 BigQuery ML 互动,以管理端到端机器学习生命周期。智能体可以根据用户请求创建和训练模型、运行评估并生成预测。
智能体运行时环境 此架构中的 AI 代理部署为无服务器 Cloud Run 服务
ADK ADK 提供用于开发、测试和部署代理的工具和框架。ADK 可抽象化智能体创建的复杂性,让 AI 开发者专注于智能体的逻辑和功能。
AI 模型和模型运行时 对于推理服务,此示例架构中的代理使用 Vertex AI 上的最新 Gemini 模型

使用的产品

此示例架构使用以下 Google Cloud 和开源产品及工具:

部署

如需部署此架构的示例实现,请使用具有多个代理的数据科学。该代码库提供了两个示例数据集来展示系统的灵活性,包括用于运营分析的航班数据集和用于业务分析的电子商务销售数据集。

后续步骤

贡献者

作者:Samantha He | 技术文档工程师

其他贡献者: