在 Cloud Run 託管 AI 代理

本頁面重點說明在 Cloud Run 上代管 AI 代理程式的用途。

AI 代理是自主軟體實體,會使用 LLM 驅動的系統感知、決策及採取行動,以達成目標。隨著自主代理的建構數量增加,其溝通和協作能力也變得至關重要。

如要瞭解 AI 代理,請參閱「什麼是 AI 代理」。

Cloud Run 上的 AI 代理用途

您可以將 AI 代理程式實作為 Cloud Run 服務,自動調度管理一組非同步工作,並透過多輪要求/回應互動提供資訊。

Cloud Run 服務是應用程式核心邏輯的可擴充 API 端點。透過自動、隨選和快速調度執行個體,有效管理多位並行使用者。

Cloud Run 上的 AI 代理架構

在 Cloud Run 上部署的典型 AI 代理架構可能涉及 Google Cloud 內外 Google Cloud的數個元件:

在 Cloud Run 上代管的 AI 代理的四個元件。
圖 1 Cloud Run 上的 AI 代理架構。

下圖顯示下列項目:

  • 代管平台:Cloud Run 是用於執行代理程式的代管平台,具有下列優點:

    • 支援執行任何代理程式架構,建構不同類型的代理程式和代理程式架構。代理程式架構的例子包括 Agent Development Kit (ADK)DifyLangGraphn8n
    • 提供內建功能,可管理代理程式。舉例來說,Cloud Run 提供內建服務身分,您可將其做為呼叫 Google Cloud API 的代理程式身分,並使用安全且自動產生的憑證。
    • 支援將代理程式架構連結至其他服務。您可以將代理程式連結至部署在 Cloud Run 上的第一方或第三方工具。舉例來說,如要瞭解代理程式的工作和執行情況,可以部署及使用 LangfuseArize 等工具。
  • 對話代理互動:Cloud Run 支援將 HTTP 回應串流傳回給使用者,以及使用 WebSockets 進行即時互動。

  • 生成式 AI 模型:自動化調度管理層會呼叫模型,以取得推論功能。 這些模型可託管於下列服務:

  • 記憶:代理通常需要記憶功能來保留脈絡,並從過去的互動中學習。 您可以使用下列服務:

  • 向量資料庫:如要進行檢索增強生成 (RAG) 或擷取結構化資料,請使用向量資料庫查詢特定實體資訊,或對嵌入項目執行向量搜尋。將 pgvector 擴充功能與下列服務搭配使用:

  • 工具:協調器會使用工具執行特定工作,與外部服務、API 或網站互動。這些實用資源包括:

    • Model Context Protocol (MCP):使用這項標準化通訊協定,與透過 MCP 伺服器執行的外部工具通訊。
    • 基本公用程式:精確的數學計算、時間轉換或其他類似公用程式。
    • API 呼叫:呼叫其他內部或第三方 API (讀取或寫入存取權)。
    • 生成圖片或圖表:快速有效地製作視覺內容。
    • 瀏覽器和作業系統自動化:在容器執行個體中執行無周邊或完整圖形作業系統,讓代理程式瀏覽網頁、從網站擷取資訊,或使用點擊和鍵盤輸入執行動作。
    • 執行程式碼:在採用多層沙箱機制的安全環境中執行程式碼,且身分與存取權管理權限極少或沒有。
    • Vertex AI Agent Engine 程式碼執行:在安全、隔離且受管理的沙箱環境中執行程式碼,支援檔案輸入和輸出、不到一秒的程式碼執行時間,以及長期記憶。請注意,如要在 Cloud Run 中使用這項功能,您需要建立至少一個 Vertex AI Agent Engine 執行個體

後續步驟