Agent Development Kit（ADK）と Vertex AI を使用してエージェント AI アプリケーションを GKE にデプロイする

Standard

このガイドでは、Google Kubernetes Engine（GKE）を使用して、コンテナ化されたエージェント AI / ML アプリケーションをデプロイおよび管理する方法について説明します。Google Agent Development Kit（ADK）と大規模言語モデル（LLM）プロバイダとしての Vertex AI を組み合わせることで、AI エージェントを効率的かつ大規模に運用できます。このガイドでは、Gemini 2.0 Flash を搭載した FastAPI ベースのエージェントを開発から GKE への本番環境デプロイまで行うエンドツーエンドのプロセスについて説明します。

このガイドは、エージェント AI / ML アプリケーションのサービングに Kubernetes コンテナオーケストレーション機能を使用することに関心がある ML エンジニア、デベロッパー、クラウドアーキテクトを対象としています。 Google Cloud のコンテンツで使用されている一般的なロールとタスクの例の詳細については、一般的な GKE ユーザーのロールとタスクをご覧ください。

始める前に、次の内容を理解しておいてください。

背景

このガイドでは、複数の Google テクノロジーを組み合わせて、エージェント AI 用のスケーラブルなプラットフォームを作成します。GKE は、ADK を使用して構築されたエージェントのコンテナオーケストレーションを提供します。LLM 推論に Vertex AI API を使用すると、推論は Google のマネージドインフラストラクチャによって処理されるため、GKE クラスタに専用の GPU ハードウェアは必要ありません。

Google の Agent Development Kit（ADK）

Agent Development Kit（ADK）は、AI エージェントの開発とデプロイ用に設計された、柔軟性の高いモジュール型のフレームワークです。ADK は Gemini と Google エコシステム向けに最適化されていますが、モデルに依存せず、デプロイに依存せず、他のフレームワークとの互換性を考慮して構築されています。

詳細については、ADK のドキュメントをご覧ください。

GKE マネージド Kubernetes サービス

GKE は、コンテナ化されたアプリケーションのデプロイ、スケーリング、管理を行うためのマネージド Kubernetes Service です。GKE は、LLM のコンピューティング需要を処理するために必要なインフラストラクチャ（スケーラブルなリソース、分散コンピューティング、効率的なネットワーキングなど）を提供します。

Kubernetes の主なコンセプトの詳細については、Kubernetes の学習を開始するをご覧ください。GKE の詳細と、GKE が Kubernetes のスケーリング、自動化、管理にどのように役立つかについては、GKE の概要をご覧ください。

Vertex AI

Vertex AI は Google Cloudの統合 ML プラットフォームで、デベロッパーは AI / ML モデルを構築、デプロイ、スケーリングできます。GKE 上のエージェント AI アプリケーションの場合、Vertex AI は、Gemini 2.0 Flash などの LLM へのアクセス、トレーニングと推論用のマネージドインフラストラクチャ、効率的なライフサイクル管理のための MLOps 機能など、不可欠なツールとサービスを提供します。

Vertex AI API を介して LLM を使用する場合、モデル推論は Google のマネージドインフラストラクチャで行われるため、GKE クラスタで特定の GPU または TPU の割り当てが必要になることはありません。

エージェント AI アプリケーション用の Vertex AI の詳細については、Vertex AI のドキュメントをご覧ください。

Gemini 2.0 Flash

Gemini 2.0 Flash は、高速、組み込みツールの使用、マルチモーダル生成、100 万トークンのコンテキストウィンドウなど、エージェントワークロード向けに設計された次世代の機能と強化された機能を提供します。Gemini 2.0 Flash は、以前の Flash モデルを改良したもので、同程度の速度で品質が向上しています。

Gemini 2.0 Flash の技術的な情報（パフォーマンスベンチマーク、トレーニングデータセットに関する情報、持続可能性への取り組み、想定される使用方法と制限事項、倫理と安全性へのアプローチなど）については、Gemini 2.0 Flash のモデルカードをご覧ください。

目標

このガイドでは、次の方法について説明します。

Google Cloud 環境をセットアップする。
エージェントのコンテナイメージをビルドする。
エージェントを GKE クラスタにデプロイする。
デプロイしたエージェントをテストする。

費用

このガイドでは、課金対象である次の Google Cloudのコンポーネントを使用します。

各サービスの料金を確認して、どの程度の費用が発生するか把握してください。

始める前に

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the required APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the required APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Make sure that you have the following role or roles on the project: roles/container.admin, roles/iam.serviceAccountAdmin, roles/artifactregistry.admin, roles/cloudbuild.builds.editor, roles/resourcemanager.projectIamAdmin
Check for the roles
1. In the Google Cloud console, go to the IAM page.
  Go to IAM
2. Select the project.
3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
1. In the Google Cloud console, go to the IAM page.
  IAM に移動
2. プロジェクトを選択します。
3. [ アクセスを許可] をクリックします。
4. [新しいプリンシパル] フィールドに、ユーザー ID を入力します。これは通常、Google アカウントのメールアドレスです。
5. [ロールを選択] リストでロールを選択します。
6. 追加のロールを付与するには、 [別のロールを追加] をクリックして各ロールを追加します。
7. [保存] をクリックします。

Agent Development Kit（ADK）と Vertex AI を使用してエージェント AI アプリケーションを GKE にデプロイする

背景

Google の Agent Development Kit（ADK）

GKE マネージド Kubernetes サービス

Vertex AI

Gemini 2.0 Flash

目標

費用

始める前に

Check for the roles

Grant the roles

環境を準備する

サンプルプロジェクトのクローンを作成する

Google Cloud リソースを作成して構成する

gcloud

Autopilot

Standard

Terraform

クラスタと通信するように `kubectl` を構成する

Workload Identity Federation for GKE アクセスを構成する

エージェントアプリケーションをデプロイして構成する

LoadBalancer

port-forward

デプロイしたエージェントをテストする

LoadBalancer

port-forward

クリーンアップ

デプロイされたリソースを削除する

gcloud

Terraform

次のステップ

Agent Development Kit（ADK）と Vertex AI を使用してエージェント AI アプリケーションを GKE にデプロイする コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

背景

Google の Agent Development Kit（ADK）

GKE マネージド Kubernetes サービス

Vertex AI

Gemini 2.0 Flash

目標

費用

始める前に

Check for the roles

Grant the roles

環境を準備する

サンプル プロジェクトのクローンを作成する

Google Cloud リソースを作成して構成する

gcloud

Autopilot

Standard

Terraform

クラスタと通信するように kubectl を構成する

Workload Identity Federation for GKE アクセスを構成する

エージェント アプリケーションをデプロイして構成する

LoadBalancer

port-forward

デプロイしたエージェントをテストする

LoadBalancer

port-forward

クリーンアップ

デプロイされたリソースを削除する

gcloud

Terraform

次のステップ

Agent Development Kit（ADK）と Vertex AI を使用してエージェント AI アプリケーションを GKE にデプロイする

サンプルプロジェクトのクローンを作成する

クラスタと通信するように `kubectl` を構成する

エージェントアプリケーションをデプロイして構成する