本文說明應用程式的高階架構,這類應用程式會執行資料科學工作流程,自動執行複雜的資料分析和機器學習工作。
這項架構使用託管於 BigQuery 或 AlloyDB for PostgreSQL 的資料集。這項架構是多代理系統,可讓使用者以自然語言指令執行動作,不必編寫複雜的 SQL 或 Python 程式碼。
本文適用於建構及管理代理式 AI 應用程式的架構師、開發人員和管理員。這個架構可讓業務和資料團隊分析零售、金融和製造等各種產業的指標。本文假設您對代理式 AI 系統有基本瞭解。如要瞭解代理與非代理系統的差異,請參閱「AI 代理、AI 助理和機器人有何不同?」
本文的「部署」一節提供程式碼範例的連結,協助您試驗部署可執行資料科學工作流程的代理程式 AI 應用程式。
架構
下圖顯示資料科學工作流程代理程式的架構。
這個架構包含下列元件:
| 元件 | 說明 |
|---|---|
| 前端 | 使用者透過前端 (例如聊天介面) 與多代理程式系統互動,前端會以無伺服器 Cloud Run 服務的形式執行。 |
| 代理 | 這項架構使用下列代理程式:
|
| 代理程式執行階段 | 這個架構中的 AI 代理程式會部署為無伺服器 Cloud Run 服務。 |
| ADK | ADK 提供工具和架構,可開發、測試及部署代理。ADK 可簡化代理的建立作業,讓 AI 開發人員專注於代理的邏輯和功能。 |
| AI 模型和模型執行階段 | 在推論服務方面,這個架構範例中的代理程式會使用 Vertex AI 上的最新 Gemini 模型。 |
使用的產品
這個範例架構使用下列 Google Cloud 和開放原始碼產品與工具:
- Cloud Run:無伺服器運算平台,可讓您在 Google 可擴充的基礎架構上直接執行容器。
- 代理開發套件 (ADK):一套工具和程式庫,可開發、測試及部署 AI 代理。
- Vertex AI:機器學習平台,可讓您訓練及部署機器學習模型和 AI 應用程式,並自訂 LLM 用於 AI 輔助的應用程式。
- Gemini:Google 開發的一系列多模態 AI 模型。
- BigQuery:企業資料倉儲,內建機器學習、地理空間分析和商業智慧等功能,有助於管理及分析資料。
- PostgreSQL 適用的 AlloyDB:與 PostgreSQL 相容的全代管資料庫服務,專為最嚴苛的工作負載 (包括混合型交易和分析處理作業) 而設計。
- 資料庫專用的 MCP Toolbox:開放原始碼的 模型上下文協定 (MCP) 伺服器,可管理連線集區、驗證和觀測等資料庫複雜性,讓 AI 代理安全地連線至資料庫。
部署
如要部署此架構的範例實作項目,請使用「Data Science with Multiple Agents」。這個存放區提供兩個範例資料集,展示系統的彈性,包括用於營運分析的航班資料集,以及用於業務分析的電子商務銷售資料集。
後續步驟
- (影片) 觀看Agent Factory Podcast,瞭解資料工程和資料科學的 AI 代理。
- (筆記本) 在 Colab Enterprise 中使用資料科學代理。
- 瞭解如何在 Cloud Run 上代管 AI 代理程式。
- 如要瞭解適用於 Google CloudAI 和機器學習工作負載的架構原則和建議,請參閱 Well-Architected Framework 中的AI 和機器學習觀點。
- 如要查看更多參考架構、圖表和最佳做法,請瀏覽 Cloud Architecture Center。
貢獻者
作者:Samantha He | 技術文件撰稿者
其他貢獻者:
- Amina Mansour | Cloud Platform 評估團隊主管
- Kumar Dhanagopal | 跨產品解決方案開發人員
- Megan O'Keefe | 開發人員服務代表
- Rachael Deacon-Smith | 開發人員服務代表
- Shir Meir Lador | 開發人員關係工程工程師經理