Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

GKE Agent Sandbox について

Autopilot Standard

Google Kubernetes Engine（GKE）Agent Sandbox を使用すると、GKE 上で分離されたステートフルな単一レプリカワークロードを管理できます。信頼できない LLM 生成コードを安全でパフォーマンスの高い環境で実行する必要がある AI エージェントランタイムなどのユースケースに最適化されています。

GKE Agent Sandbox アドオンは、オープンソースの Agent Sandbox コントローラプロジェクトに基づいており、そのリリースサイクルに従います。マネージド GKE アドオンとして、Google は自動アップグレードやセキュリティパッチなど、コントローラのライフサイクル全体を管理します。

このドキュメントでは、GKE Agent Sandbox の概要について説明します。

GKE Agent Sandbox を使用する理由

GKE Agent Sandbox は、高度なスケーリング、拡張性、セキュリティを必要とするエージェントワークロード向けに構築されています。主な特典は次のとおりです。

カーネルレベルの分離: 信頼できない LLM 生成コードに対して、強力なカーネルレベルの分離を提供します。Agent Sandbox は、オープンソースの Kata Containers とも連携します。GKE Agent Sandbox でオープンソースの Kata Containers を使用するチュートリアルについては、 GKE で Kata Containers を有効にするをご覧ください。

注: Kata Containers は Google Cloud プロダクトではありません。このソフトウェアをインストールして使用する場合、管理とトラブルシューティングはお客様の責任となります。Google のサポートと SLA は Kata Containers には適用されません。
1 秒未満のプロビジョニング: 標準の Kubernetes Pod スケジューリングよりも大幅に高速（通常は 1 秒未満）でサンドボックスを提供する、すぐに使用できるメカニズムを提供します。
クラウドネイティブな拡張性: Kubernetes パラダイムの能力と GKE のマネージドインフラストラクチャを活用します。

宣言型で標準化された API を提供することで、GKE Agent Sandbox は、Kubernetes プリミティブのみで構築された仮想マシン（VM）と同様の分離と永続性の特性を備えたシングルコンテナエクスペリエンスを提供します。

Agent Sandbox の一般的なユースケース

分離、永続性、安定した ID を必要とするワークロードには、GKE Agent Sandbox を使用します。たとえば、次のような場合があります。

gVisor などのセキュリティ重視のランタイムによって分離された環境で、信頼できないコードを安全に実行します。
開発環境: デベロッパーに永続的で分離されたクラウドベースのコーディング環境を提供します。
ノートブックと調査ツール: Jupyter Notebook などのインタラクティブツール用のシングルコンテナセッションをホストします。
ステートフルなシングル Pod サービス: StatefulSet の複雑さを伴わずに、安定した ID とストレージを必要とするアプリケーションを実行します。
プログラムによる環境管理: Agent Sandbox Python SDK などの提供されたクライアントライブラリ SDK を使用して、Kubernetes YAML を管理せずに、アプリケーションロジックからサンドボックスを直接リクエストして管理します。

GKE Agent Sandbox の仕組み

GKE Agent Sandbox は、カスタムコントローラと複数の Kubernetes カスタムリソース定義（CRD）を使用して、サンドボックス化された環境のライフサイクルを管理します。

コアアーキテクチャ

Sandbox CRD: 単一のステートフル Pod を表すプライマリリソース。安定したホスト名、ネットワーク ID、永続ストレージを管理します。
Sandbox Router: 安定したエンドポイントを提供し、トラフィックを適切な Sandbox Pod にトンネリングして、基盤となるネットワークの複雑さを抽象化するコンポーネント。
Pod スナップショットとの統合: GKE Agent Sandbox はGKE Pod スナップショット機能と統合され、コンテナの完全な状態を保存して復元することで、ワークロードの一時停止と再開を可能にします。

クレームモデル

クレームモデル は、環境に対するユーザーのリクエストを、ワークロードのプロビジョニング場所や方法などの具体的な実装の詳細から分離する重要な機能です。標準の Kubernetes StatefulSet とは異なり、クレームモデルを使用すると、基盤となる Pod またはストレージ構成を直接管理しなくても、サンドボックスをリクエストできます。

クレームモデルは SandboxClaimと SandboxTemplate CRD を使用して管理され、次のように動作します。

ユーザーまたはアプリケーションは、SandboxTemplate を参照する SandboxClaim を作成して、サンドボックスをリクエストします。
コントローラは、クレームから実際の Sandbox インスタンスへのマッピングを処理し、柔軟なバックエンド管理を提供します。これにより、システムは既存のサンドボックスを再利用したり、プールから割り当てたりできます。

ウォームプール

ウォームプール 機能は、インタラクティブな AI エージェントシナリオで重要な起動レイテンシを最小限に抑えるように設計されています。この機能により、Agent Sandbox は 1 秒未満で実行環境を提供できます。これは、一般的な Pod スケジューリングよりも大幅に高速です。この機能は SandboxWarmPool CRD を使用して管理され、次のように動作します。

SandboxWarmPool は、事前ウォーミングされた Pod インスタンスのセットを準備完了状態で維持します。
SandboxClaim が作成されると、コントローラは新しい Pod がイメージをプルして最初から起動するのを待つのではなく、プールから Pod を即座に割り当てます。
ウォームプールを Pod スナップショットと組み合わせると、事前構成された状態から Pod を復元することで、高速な「インスタントオン」機能が提供されます。

ネットワーク分離

GKE Agent Sandbox は、すべてのサンドボックス化された環境にデフォルトで拒否 のネットワークセキュリティ体制を実装します。これにより、サンドボックス内で実行される信頼できないコードは、デフォルトで承認されていない内部ネットワークや GKE コントロールプレーンにアクセスできません。SandboxTemplate 内で特定のネットワーク制限と許可された下り（外向き）または上り（内向き）のルールを定義して、エージェントワークロードにきめ細かいセキュリティを提供できます。

SDK を使用したプログラムによるアクセス

AI エンジニアは、提供されたクライアントライブラリを使用して、GKE Agent Sandbox リソースをプログラムで利用できます。たとえば、Python SDK は、基盤となる SandboxClaim 構成と SandboxTemplate 構成を抽象化する高レベルのインターフェースを提供します。これにより、LangChain や Vertex AI Agentic SDK などの Python ベースのエージェントフレームワークから、分離された環境を直接作成して操作できます。

制限事項と要件

GKE Agent Sandbox には、次の制限事項と要件があります。

クラスタバージョン: スナップショットなどのすべての機能を使用するには、GKE バージョン 1.35.2-gke.1269000 以降が必要です。
インフラストラクチャ要件: 特定のノード構成（N2 マシンタイプなど）に最適化されており、Agent Sandbox コントローラをクラスタにインストールして構成する必要があります。
分離ランタイム: 複数のランタイムをサポートしていますが、主に gVisor などのセキュリティ強化されたランタイムで使用することを想定しています。
基盤となる機能の可用性: GKE Pod スナップショットなど、一部の基盤となる機能はプレビュー版であるか、特定のリージョンでのみ利用可能である可能性があります。

次のステップ

GKE で Agent Sandbox を有効にする方法を学習する。
Agent Sandbox を使用して AI コード実行を分離する方法について学習する。
Agent Sandbox で Pod スナップショットを使用する方法については、保存と復元 Pod スナップショットを使用して Agent Sandbox 環境を保存して復元するをご覧ください。
Agent Sandbox でオープンソースのKata Containers を使用する方法を学習する。 Kata Containers はプロダクトではありません。 Google Cloud このソフトウェアをインストールして使用する場合、管理とトラブルシューティングはお客様の責任となります。 Google のサポートと SLA は Kata Containers には適用されません。
基盤となるオープンソース実装については、Agent Sandbox GitHub プロジェクトをご覧ください。
コードの実行やコンピュータの使用などのシナリオの実行ランタイムと YAML 構成の例については、Agent Sandbox の例をご覧ください。
サンドボックスをプログラムで操作するには、GitHub の Agent Sandbox Python SDK README をご覧ください。