在 Cloud Run 託管 AI 代理

本頁面重點說明在 Cloud Run 上代管 AI 代理程式的用途。

AI 代理是自主軟體實體，會使用 LLM 驅動的系統感知、決策及採取行動，以達成目標。隨著自主代理的建構數量增加，其溝通和協作能力也變得至關重要。

如要瞭解 AI 代理，請參閱「什麼是 AI 代理」。

Cloud Run 上的 AI 代理用途

您可以將 AI 代理程式實作為 Cloud Run 服務，自動調度管理一組非同步工作，並透過多輪要求/回應互動提供資訊。

Cloud Run 服務是應用程式核心邏輯的可擴充 API 端點。透過自動、隨選和快速調度執行個體，有效管理多位並行使用者。

Cloud Run 上的 AI 代理架構

在 Cloud Run 上部署的典型 AI 代理架構可能涉及 Google Cloud 內外 Google Cloud的數個元件：

在 Cloud Run 上代管的 AI 代理的四個元件。 — **圖 1** Cloud Run 上的 AI 代理架構。

下圖顯示下列項目：

代管平台：Cloud Run 是用於執行代理程式的代管平台，具有下列優點：
- 支援執行任何代理程式架構，建構不同類型的代理程式和代理程式架構。代理程式架構的例子包括 Agent Development Kit (ADK)、Dify、LangGraph 和 n8n。
- 提供內建功能，可管理代理程式。舉例來說，Cloud Run 提供內建服務身分，您可將其做為呼叫 Google Cloud API 的代理程式身分，並使用安全且自動產生的憑證。
- 支援將代理程式架構連結至其他服務。您可以將代理程式連結至部署在 Cloud Run 上的第一方或第三方工具。舉例來說，如要瞭解代理程式的工作和執行情況，可以部署及使用 Langfuse 和 Arize 等工具。
對話代理互動：Cloud Run 支援將 HTTP 回應串流傳回給使用者，以及使用 WebSockets 進行即時互動。
生成式 AI 模型：自動化調度管理層會呼叫模型，以取得推論功能。這些模型可託管於下列服務：
- Gemini API 適用於 Google 的生成式 AI 模型。
- 自訂模型或其他基礎模型的 Vertex AI 端點。
- 啟用 GPU 的 Cloud Run 服務，適用於您自行微調的模型。
記憶：代理通常需要記憶功能來保留脈絡，並從過去的互動中學習。您可以使用下列服務：
- Memorystore for Redis，用於短期記憶。
- Firestore 可做為長期記憶體，例如儲存對話記錄，或根據原始資料記住使用者的偏好設定。
- Vertex AI Agent Engine Memory Bank 可長期儲存個人化記憶內容。這項功能會自動從使用者的對話記錄中擷取資訊，以便記憶及更新使用者的偏好設定。請注意，如要透過 Cloud Run 使用這項功能，您必須至少建立一個 Agent Engine 執行個體。
向量資料庫：如要進行檢索增強生成 (RAG) 或擷取結構化資料，請使用向量資料庫查詢特定實體資訊，或對嵌入項目執行向量搜尋。將 pgvector 擴充功能與下列服務搭配使用：
- PostgreSQL 適用的 Cloud SQL
- AlloyDB for PostgreSQL
工具：協調器會使用工具執行特定工作，與外部服務、API 或網站互動。這些實用資源包括：
- Model Context Protocol (MCP)：使用這項標準化通訊協定，與透過 MCP 伺服器執行的外部工具通訊。
- 基本公用程式：精確的數學計算、時間轉換或其他類似公用程式。
- API 呼叫：呼叫其他內部或第三方 API (讀取或寫入存取權)。
- 生成圖片或圖表：快速有效地製作視覺內容。
- 瀏覽器和作業系統自動化：在容器執行個體中執行無周邊或完整圖形作業系統，讓代理程式瀏覽網頁、從網站擷取資訊，或使用點擊和鍵盤輸入執行動作。
- 執行程式碼：在採用多層沙箱機制的安全環境中執行程式碼，且身分與存取權管理權限極少或沒有。
- Vertex AI Agent Engine 程式碼執行：在安全、隔離且受管理的沙箱環境中執行程式碼，支援檔案輸入和輸出、不到一秒的程式碼執行時間，以及長期記憶。請注意，如要在 Cloud Run 中使用這項功能，您需要建立至少一個 Vertex AI Agent Engine 執行個體。

後續步驟

觀看「在 Cloud Run 建構 AI 代理」。
請嘗試程式碼研究室，瞭解如何建構 LangChain 應用程式並部署至 Cloud Run。
瞭解如何將 Agent Development Kit (ADK) 部署至 Cloud Run。
請嘗試使用程式碼研究室，瞭解如何透過 ADK 代理在 Cloud Run 上使用 MCP 伺服器。
請嘗試將 ADK 代理程式部署到 Cloud Run with GPU 的程式碼研究室。
在 Agent Development Kit (ADK) 範例中尋找現成可用的代理範例。
在 Cloud Run 託管 Model Context Protocol (MCP) 伺服器。

在 Cloud Run 託管 AI 代理 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

Cloud Run 上的 AI 代理用途

Cloud Run 上的 AI 代理架構

後續步驟

在 Cloud Run 託管 AI 代理