エージェント ランタイム は、デベロッパーが本番環境で AI エージェントをデプロイ、管理、スケールできるようにする一連のサービスです。本番環境でエージェントをスケーリングするためのインフラストラクチャの処理はエージェント ランタイムが行うため、デベロッパーはアプリケーションの作成に注力できます。エージェント ランタイムで提供されるサービスは次のとおりです。これらは、個別に使用することも組み合わせて使用することもできます。
- ランタイム:
- エージェントをデプロイしてスケーリングします マネージド ランタイムとエンドツーエンドの管理機能を使用して。
- システム依存関係のビルド時のインストール スクリプトを使用して、エージェントのコンテナ イメージをカスタマイズします。
- VPC-SC コンプライアンスや認証と IAM の設定などのセキュリティ機能を使用します。
- 関数呼び出しなどのモデルやツールにアクセスします。
- さまざまな Python フレームワークと Agent2Agent オープン プロトコルを使用して構築されたエージェントをデプロイします。
- 品質と評価 (プレビュー): 統合された Gen AI Evaluation Service でエージェントの品質を評価し、Gemini モデルのトレーニング実行でエージェントを最適化します。
- Agent Platform Sessions: Agent Platform Sessions を使用すると、 ユーザーとエージェント間の個々のインタラクションを保存できるため、 会話のコンテキストの明確なソースを提供可能
- Agent Platform Memory Bank: Agent Runtime Agent Platform Memory Bank を使用すると、セッションから情報を保存して取得し、エージェントのインタラクションをパーソナライズできます。
- コードを実行する: Agent Runtime Code Execution を使用すると、エージェントは隔離された安全な マネージド サンドボックス環境でコードを実行できます。
- Example Store (プレビュー): 少数ショットの例を保存して動的に取得し、エージェントのパフォーマンスを改善します。
- オブザーバビリティ: Google Cloud Trace( OpenTelemetry をサポート)、 Cloud Monitoring、 Cloud Logging を使用して、エージェントの動作を把握します。
- ガバナンス: エージェント ランタイムは、本番環境でエージェントを
管理し、セキュリティとエンタープライズのニーズを満たすのに役立つ機能をいくつかサポートしています。
- Security Command Center で脅威を検出する: Agent Runtime Threat Detection (プレビュー)は、Security Command Center の組み込みサービスです。このサービスは、Agent Runtime にデプロイされたエージェントに対する潜在的な攻撃を検出して 調査するのに役立ちます。
- エージェント ID (プレビュー): Identity Access Management (IAM)エージェント ID を使用して、Agent Runtime でエージェントを使用する際に セキュリティ機能とアクセス管理機能を提供します。
- エージェント ゲートウェイ (プレビュー): エージェント ゲートウェイを使用して、エージェント 通信のルールを定義し、プロジェクトとの間で接続する エージェント、クライアント、ツール全体にセキュリティ ポリシーとアクセス制御ポリシーを適用します。 Google Cloud
エージェント ランタイムで作成してデプロイする
エージェント ランタイムでエージェントを構築するワークフローは次のとおりです。
- 環境を設定する: Google プロジェクトを設定し、最新バージョンの Agent Platform SDK for Python をインストールします。
- エージェントを開発する: エージェント ランタイムにデプロイできるエージェントを開発します。
- エージェントをデプロイする: エージェントをエージェント ランタイム マネージド ランタイムにデプロイします。
- **エージェントを使用する**: API リクエストを送信してエージェントをクエリします。
- デプロイされた エージェントを管理する: エージェント ランタイムにデプロイしたエージェントを管理して 削除します。
次の図は、このプロセスを示しています。
サポートされているフレームワーク
次の表に、各種のエージェント フレームワークに対してエージェント ランタイムが提供するサポートレベルを示します。
| サポートレベル | エージェント フレームワーク |
|---|---|
| カスタム テンプレート: カスタム テンプレートを適応させて、 フレームワークからエージェント ランタイムへのデプロイをサポートできます。 | CrewAI、 カスタム フレームワーク |
| Agent Platform SDK の統合: エージェント ランタイムは、Agent Platform SDK とドキュメントでフレームワークごとにマネージド テンプレートを提供します。 | AG2、 LlamaIndex |
| 完全な統合: 機能は、 フレームワーク、エージェント ランタイム、より広範な Google Cloud エコシステム全体で機能するように統合されています。 | Agent Development Kit (ADK)、LangChain、LangGraph |
Agents CLI を使用して本番環境にデプロイする
Agents CLI は、Gemini Enterprise Agent Platform の統合 コマンドライン インターフェースとスキルセットです。 コーディング エージェントとデベロッパーに、エージェント開発ライフサイクル(スキャフォールディング、評価、デプロイ、公開、モニタリング)の予測可能なパスを提供します。 Agents CLI には次のものが含まれています。
- 事前構築済みのエージェント テンプレート: ReAct、RAG、マルチエージェントなどのテンプレート。
- インタラクティブなプレイグラウンド: エージェントをテストして操作します。
- 自動化されたインフラストラクチャ: リソース管理の合理化のために Terraformを使用しています。
- CI/CD パイプライン: Cloud Build を活用した自動デプロイ ワークフロー。
- オブザーバビリティ: Cloud Trace と Cloud Logging の組み込みのサポート。
利用を開始するには、 クイックスタートをご覧ください。
ユースケース
エンドツーエンドの例を使用してエージェント ランタイムの詳細を確認するには、次のリソースをご覧ください。
クリックしてユースケースを開く
エンタープライズ セキュリティ
エージェント ランタイムは、企業のセキュリティ要件を満たし、組織のセキュリティ ポリシーを遵守し、セキュリティのベスト プラクティスに従うのに役立つ機能をいくつかサポートしています。次の機能がサポートされています。
VPC Service Controls: エージェント ランタイムは、データ セキュリティを強化し、データの引き出しのリスクを軽減するために、VPC Service Controlsをサポートしています。VPC Service Controls が構成されている場合、デプロイされたエージェントは、BigQuery API、Cloud SQL Admin API、Agent Platform API などの Google API とサービスへの安全なアクセスを維持し、定義された境界内でのシームレスなオペレーションを確認します。VPC Service Controls は、すべての公共のインターネット アクセスを効果的にブロックし、データ移動を承認済みネットワーク境界内に制限することで、企業のセキュリティ ポスチャーを大幅に強化します。
エージェント ゲートウェイでは VPC Service Controls はサポートされていません。 ただし、カスタム組織ポリシーの制約を使用して、エージェントに関連付けることができるゲートウェイを制限できます。詳細については、 エージェント ゲートウェイを介してトラフィックをルーティングするをご覧ください。
Private Service Connect インターフェース: エージェント ランタイムの場合、 PSC-I を使用すると、エージェントはユーザーの VPC でプライベートにホストされているサービスとやり取りできます。詳細については、エージェント ランタイムで Private Service Connect インターフェースを使用するをご覧ください。
顧客管理の暗号鍵(CMEK): エージェント ランタイムは、独自の暗号鍵でデータを保護する CMEKをサポートしています。 これにより、 で保存データを保護する鍵の所有権と完全な制御を保持できます Google Cloud。詳細については、エージェント ランタイム CMEK をご覧ください。
データ所在地(DRZ): エージェント ランタイムは、すべての保存データが指定されたリージョン内に 保存されるように、データ所在地(DRZ)をサポートしています。
HIPAA: Agent Platform の一部として、エージェント ランタイム は HIPAA ワークロードをサポートしています。
アクセスの透明性: アクセスの透明性では、コンテンツへのアクセス時に Google の担当者が行うアクションを記録したログが 提供されます。エージェント ランタイムでアクセスの透明性を有効にする方法の詳細については、 Agent Platform の アクセスの透明性をご覧ください。
次の表に、Agent Platform の各サービスでサポートされているエンタープライズ セキュリティ機能を示します。
| セキュリティ機能 | エージェント ランタイム | セッション | Memory Bank | Example Store | コードを実行する |
|---|---|---|---|---|---|
| VPC Service Controls | はい | はい | はい | いいえ | はい |
| 顧客管理の暗号鍵 | はい | はい | はい | いいえ | はい |
| データ所在地(DRZ)(保存時) | はい | はい | はい | いいえ | はい |
| HIPAA | はい | はい | はい | はい | はい |
| アクセスの透明性 | はい | はい | はい | いいえ | いいえ |
| アクセス承認 | はい | はい | はい | いいえ | いいえ |
サポートされるリージョン
エージェント ランタイムでサポートされているリージョンの一覧については、 ロケーション をご覧ください。
Quota
エージェント ランタイムの割り当て情報については、割り当てとシステム の上限をご覧ください。
料金
エージェント ランタイムでは無料枠を利用できます。エージェント ランタイムの料金については、Gemini Enterprise Agent Platform の料金をご覧ください。
クライアント ベースの SDK への移行
Agent Platform SDK 内の agent_engines モジュールは、主に次の理由から、クライアント ベースの設計にリファクタリングされています。
- Agent Development Kit(ADK)と Google Gen AI SDK の標準の型表現に合わせるため。これにより、さまざまな SDK で一貫性のある標準化された方法でデータ型が表現されるため、相互運用が簡単になり、変換のオーバーヘッドが軽減されます。
- マルチプロジェクト マルチロケーションのアプリケーションで Google Cloud パラメータのスコープをクライアント レベルで設定するため。これにより、各クライアント インスタンスを特定のプロジェクトと位置情報の設定で構成することで、異なる Google Cloud プロジェクトや地理的位置にわたるリソースとのインタラクションをアプリケーションで管理できます。
- エージェント ランタイム サービスの見つけやすさとまとまりを向上させるため。