Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

關於 GKE Agent Sandbox

自動駕駛標準

Google Kubernetes Engine (GKE) Agent Sandbox 可協助您管理 GKE 上獨立、具狀態且單一副本的工作負載。這項服務專為 AI 代理執行階段等用途最佳化，可確保在安全且高效能的環境中執行不受信任的 LLM 生成程式碼。

GKE Agent Sandbox 外掛程式是以開放原始碼的 Agent Sandbox 控制器專案為基礎，並遵循該專案的發布週期。做為代管 GKE 外掛程式，Google 會管理控制器的完整生命週期，包括自動升級和安全性修補程式。

本文提供 GKE Agent Sandbox 的概念總覽。

使用 GKE Agent Sandbox 的理由

GKE Agent Sandbox 專為需要高層級擴充性、延展性和安全性的代理式工作負載而建構。主要優點如下：

核心層級隔離：為不受信任的 LLM 生成程式碼提供強大的核心層級隔離機制。Agent Sandbox 也適用於開放原始碼的 Kata Containers。如需使用開放原始碼 Kata Containers 和 GKE Agent Sandbox 的教學課程，請參閱「在 GKE 上啟用 Kata Containers」。

注意： Kata Containers 不是 Google Cloud 產品。如果您安裝及使用這項軟體，則必須負責管理及排解問題。Google 的支援和服務水準協議不適用於 Kata Containers。
秒級佈建：提供現成機制，可大幅加快沙箱佈建速度，比標準 Kubernetes Pod 排程允許的速度快 (通常 <1 秒)。
雲端原生擴充性：充分運用 Kubernetes 範例和 GKE 的代管基礎架構。

GKE Agent Sandbox 提供宣告式標準化 API，可提供單一容器體驗，並完全以 Kubernetes 基本元素為基礎，提供類似虛擬機器的隔離和持續性特徵。

Agent Sandbox 的常見用途

對於需要隔離、持續性和穩定身分的工作負載，請使用 GKE Agent Sandbox。使用案例範例包括：

AI 代理執行階段：在由 gVisor 等以安全性為重的執行階段隔離的環境中，安全地執行不受信任的程式碼。
開發環境：為開發人員提供持續性、獨立的雲端程式碼編寫環境。
筆記本和研究工具：為 Jupyter Notebooks 等互動式工具代管單一容器工作階段。
具狀態的單一 Pod 服務：執行需要穩定身分和儲存空間的應用程式，無須複雜的 StatefulSet。
以程式輔助管理環境：使用提供的用戶端程式庫 SDK (例如 Agent Sandbox Python SDK)，直接從應用程式邏輯要求及管理沙箱，不必管理 Kubernetes YAML。

GKE Agent Sandbox 的運作方式

GKE Agent Sandbox 會使用自訂控制器和多個 Kubernetes 自訂資源定義 (CRD)，管理沙箱環境的生命週期。

核心架構

沙箱 CRD：主要資源，代表單一有狀態的 Pod。可管理穩定主機名稱、網路身分和永久儲存空間。
沙箱路由器：這個元件提供穩定的端點，並將流量導向適當的沙箱 Pod，抽象化底層網路的複雜性。
與 Pod 快照整合：GKE Agent Sandbox 與 GKE Pod 快照功能整合，可儲存及還原容器的完整狀態，藉此暫停及繼續工作負載。

聲明模型

聲明模型是一項重要功能，可將使用者對環境的要求與特定實作詳細資料 (例如工作負載的佈建位置和方式) 分開。與標準 Kubernetes StatefulSet 不同，聲明模型可讓您要求沙箱，而不必直接管理基礎 Pod 或儲存空間設定。

系統會使用 SandboxClaim 和 SandboxTemplate CRD 管理 Claim 模型，運作方式如下：

使用者或應用程式建立參照SandboxTemplate的SandboxClaim，即可要求使用沙箱。
控制器會處理聲明對應至實際 Sandbox 執行個體的作業，提供彈性的後端管理功能。這可讓系統重複使用現有 Sandbox，或從集區分配 Sandbox。

溫水游泳池

暖集區功能旨在盡量縮短啟動延遲時間，這對互動式 AI 代理情境至關重要。這項功能可讓 Agent Sandbox 在不到一秒內提供執行環境，比一般的 Pod 排程快得多。這項功能是使用 SandboxWarmPool CRD 管理，運作方式如下：

SandboxWarmPool 會維護一組處於就緒狀態的預先暖機 Pod 執行個體。
建立 SandboxClaim 時，控制器會立即從集區指派 Pod，而不是等待新 Pod 提取映像檔並從頭開始。
搭配 Pod 快照使用時，暖池可從預先設定的狀態還原 Pod，提供快速的「即時啟動」功能。

網路隔離

GKE Agent Sandbox 會為所有沙箱環境實作「預設拒絕」網路安全防護措施。這麼做可確保在沙箱中執行的不受信任程式碼，預設無法存取未經授權的內部網路或 GKE 控制層。您可以在 SandboxTemplate 中定義特定網路限制和允許的輸出或輸入規則，為代理程式工作負載提供精細的安全防護。

透過 SDK 進行程式輔助存取

AI 工程師可以使用提供的用戶端程式庫，以程式輔助方式使用 GKE Agent Sandbox 資源。舉例來說，Python SDK 提供高階介面，可抽象化底層的 SandboxClaim 和 SandboxTemplate 設定。這可讓您直接從 Python 型代理架構 (例如 LangChain 或 Vertex AI Agentic SDK) 建立及互動獨立環境。

限制與需求

GKE Agent Sandbox 具有下列限制和需求：

叢集版本：如要完整支援所有功能 (包括快照)，必須使用 GKE 1.35.2-gke.1269000 以上版本。
基礎架構需求：針對特定節點設定 (例如 N2 機型) 進行最佳化，且需要在叢集上安裝及設定 Agent Sandbox 控制器。
隔離執行階段：雖然支援多個執行階段，但主要用途是搭配 gVisor 等安全強化型執行階段使用。
基礎功能適用情形：部分基礎功能 (例如 GKE Pod 快照) 可能處於預先發布階段，或僅適用於特定區域。

後續步驟

瞭解如何在 GKE 上啟用 Agent Sandbox。
進一步瞭解如何使用 Agent Sandbox 隔離 AI 程式碼執行作業。
如要瞭解如何在 Agent Sandbox 中使用 Pod 快照，請參閱使用 Pod 快照儲存及還原 Agent Sandbox 環境。
瞭解如何搭配使用開放原始碼的 Kata Containers 與 Agent Sandbox。Kata Containers 並非 Google Cloud 產品，如果您安裝及使用這項軟體，則須負責管理及排解問題。Google 的支援服務和服務水準協議不適用於 Kata Containers。
如要瞭解基礎開放原始碼實作方式，請參閱 Agent Sandbox GitHub 專案。
如要查看程式碼執行或電腦使用等情境的執行階段和 YAML 設定範例，請參閱「Agent Sandbox 範例」。
如要以程式輔助方式與沙箱互動，請參閱 GitHub 上的代理程式沙箱 Python SDK README。