代理式 AI 用途:自動化資料科學工作流程

本文說明應用程式的高階架構,這類應用程式會執行資料科學工作流程,自動執行複雜的資料分析和機器學習工作。

這項架構使用託管於 BigQuery 或 AlloyDB for PostgreSQL 的資料集。這項架構是多代理系統,可讓使用者以自然語言指令執行動作,不必編寫複雜的 SQL 或 Python 程式碼。

本文適用於建構及管理代理式 AI 應用程式的架構師、開發人員和管理員。這個架構可讓業務和資料團隊分析零售、金融和製造等各種產業的指標。本文假設您對代理式 AI 系統有基本瞭解。如要瞭解代理與非代理系統的差異,請參閱「AI 代理、AI 助理和機器人有何不同?

本文的「部署」一節提供程式碼範例的連結,協助您試驗部署可執行資料科學工作流程的代理程式 AI 應用程式。

架構

下圖顯示資料科學工作流程代理程式的架構。

資料科學工作流程代理程式的架構。

這個架構包含下列元件:

元件 說明
前端 使用者透過前端 (例如聊天介面) 與多代理程式系統互動,前端會以無伺服器 Cloud Run 服務的形式執行。
代理 這項架構使用下列代理程式:
  • 根代理程式協調代理程式,負責接收前端服務的要求。根代理程式會解讀使用者要求,並嘗試自行解決要求。如果任務需要特殊工具,根代理程式會將要求委派給適當的專業代理程式。
  • 專業代理程式:根代理程式會使用「將代理程式做為工具」功能,叫用下列專業代理程式。
    • 數據分析代理:專門用於資料分析和視覺化的代理。分析代理程式會使用 AI 模型生成及執行 Python 程式碼,處理資料集、建立圖表,以及執行統計分析。
    • PostgreSQL 適用的 AlloyDB 代理程式:專門用來與 PostgreSQL 適用的 AlloyDB 中的資料互動。代理程式會使用 AI 模型解讀使用者要求,並以 PostgreSQL 方言生成 SQL。代理程式會使用 MCP Toolbox for Databases 安全地連線至資料庫,然後執行查詢來擷取要求的資料。
    • BigQuery 代理:專門用來與 BigQuery 中的資料互動的代理。代理會使用 AI 模型解讀使用者要求,並生成 GoogleSQL 查詢。代理程式會使用代理程式開發套件 (ADK) 的內建 BigQuery 工具連線至資料庫,然後執行查詢來擷取要求的資料。
  • BigQuery ML 代理程式:根代理程式的子代理程式,專用於機器學習工作流程。這個代理程式會與 BigQuery ML 互動,管理端對端機器學習生命週期。代理程式可以建立及訓練模型、執行評估,並根據使用者要求生成預測結果。
代理程式執行階段 這個架構中的 AI 代理程式會部署為無伺服器 Cloud Run 服務
ADK ADK 提供工具和架構,可開發、測試及部署代理。ADK 可簡化代理的建立作業,讓 AI 開發人員專注於代理的邏輯和功能。
AI 模型和模型執行階段 在推論服務方面,這個架構範例中的代理程式會使用 Vertex AI 上的最新 Gemini 模型

使用的產品

這個範例架構使用下列 Google Cloud 和開放原始碼產品與工具:

部署

如要部署此架構的範例實作項目,請使用「Data Science with Multiple Agents」。這個存放區提供兩個範例資料集,展示系統的彈性,包括用於營運分析的航班資料集,以及用於業務分析的電子商務銷售資料集。

後續步驟

貢獻者

作者:Samantha He | 技術文件撰稿者

其他貢獻者: