Cloud Run で AI エージェントをホストする

このページでは、Cloud Run で AI エージェントをホストするユースケースについて説明します。

AI エージェントは、LLM を搭載したシステムを使用して、目標を達成するために認識、決定、行動を行う自律型ソフトウェアエンティティです。自律型エージェントの構築が進むにつれて、エージェント間のコミュニケーションとコラボレーションの能力が重要になります。

AI エージェントの概要については、AI エージェントとはをご覧ください。

Cloud Run での AI エージェントのユースケース

AI エージェントを Cloud Run サービスとして実装すると、一連の非同期タスクをオーケストレートし、複数のリクエスト / レスポンスインタラクションを通じて情報を提供できます。

Cloud Run サービスは、アプリケーションのコアロジック用のスケーラブルな API エンドポイントです。インスタンスの自動オンデマンド高速スケーリングにより、複数のユーザーを同時に効率的に管理します。

Cloud Run 上の AI エージェントアーキテクチャ

Cloud Run にデプロイされる一般的な AI エージェントアーキテクチャには、 Google Cloud のコンポーネントだけでなく、 Google Cloudの外部にあるコンポーネントが含まれる場合があります。

Cloud Run でホストされている AI エージェントの 4 つのコンポーネント。 — **図 1.** Cloud Run 上の AI エージェントのアーキテクチャ。

この図は次のことを示しています。

ホスティングプラットフォーム: Cloud Run は、エージェントを実行するためのホスティングプラットフォームであり、次のようなメリットがあります。
- 任意のエージェントフレームワークを実行して、さまざまなタイプのエージェントとエージェントアーキテクチャを構築できます。エージェントフレームワークの例としては、Agent Development Kit（ADK）、Dify、LangGraph、n8n などがあります。
- エージェントを管理するための組み込み機能を提供します。たとえば、Cloud Run には、安全で自動的な認証情報を使用して Google Cloud API を呼び出すためのエージェント ID として使用できる組み込みのサービス ID が用意されています。
- エージェントフレームワークを他のサービスに接続することをサポートします。エージェントを Cloud Run にデプロイされたファーストパーティまたはサードパーティのツールに接続できます。たとえば、エージェントのタスクと実行を可視化するには、Langfuse や Arize などのツールをデプロイして使用します。
エージェントのインタラクション: Cloud Run は、ユーザーへの HTTP レスポンスのストリーミングと、リアルタイムインタラクション用の WebSockets をサポートしています。
生成 AI モデル: オーケストレーションレイヤは、推論機能のモデルを呼び出します。これらのモデルは、次のようなサービスでホストできます。
- Gemini API（Google の生成 AI モデル）
- Vertex AI エンドポイント（カスタムモデルまたはその他の基盤モデル）
- GPU 対応の Cloud Run サービス（独自のファインチューニング済みモデル）
メモリ: エージェントは、コンテキストを保持し、過去のやり取りから学習するためにメモリを必要とすることがよくあります。次のサービスを使用できます。
- 短期記憶用の Memorystore for Redis。
- 会話履歴の保存やユーザーの設定の記憶など、長期記憶用の Firestore。
ベクトルデータベース: 検索拡張生成（RAG）または構造化データの取得には、ベクトルデータベースを使用して特定のエンティティ情報をクエリするか、エンベディングに対してベクトル検索を実行します。次のサービスで pgvector 拡張機能を使用します。
- Cloud SQL for PostgreSQL
- AlloyDB for PostgreSQL
ツール: オーケストレーターは、外部サービス、API、ウェブサイトを操作するために特定のタスクを実行するツールを使用します。これには次のものが含まれます。
- Model Context Protocol（MCP）: この標準化されたプロトコルを使用して、MCP サーバーを介して実行される外部ツールと通信します。
- 基本的なユーティリティ: 正確な算術演算、時刻の換算、その他の同様のユーティリティ。
- API 呼び出し: 他の内部 API またはサードパーティ API（読み取りまたは書き込みアクセス）を呼び出します。
- 画像やグラフの生成: ビジュアルコンテンツを迅速かつ効率的に作成します。
- ブラウザと OS の自動化: コンテナインスタンス内でヘッドレスまたは完全なグラフィカルオペレーティングシステムを実行し、エージェントがウェブをブラウジングしたり、ウェブサイトから情報を抽出したり、クリックやキーボード入力を使用してアクションを実行できるようにします。
- コードの実行: 多層サンドボックス化による安全な環境で、IAM 権限を最小限に抑えてコードを実行します。

次のステップ

Cloud Run で AI エージェントを構築するを視聴する。
LangChain アプリをビルドして Cloud Run にデプロイする方法を学習するための Codelab を試す。
エージェント開発キット（ADK）を Cloud Run にデプロイする方法を確認する。
ADK エージェントで Cloud Run の MCP サーバーを使用するための Codelab を試す。
GPU を使用して ADK エージェントを Cloud Run にデプロイするための Codelab を試す。
すぐに使用できるエージェントのサンプルを Agent Development Kit（ADK）のサンプルで確認する。
Cloud Run で Model Context Protocol（MCP）サーバーをホストする。

Cloud Run で AI エージェントをホストする コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

Cloud Run での AI エージェントのユースケース

Cloud Run 上の AI エージェント アーキテクチャ

次のステップ

Cloud Run で AI エージェントをホストする

Cloud Run 上の AI エージェントアーキテクチャ