Gemini Enterprise Agent Platform には、トレーニング済みのモデル アーティファクトから推論と説明を行うため、ビルド済みコンテナとして実行できる Docker コンテナ イメージが用意されています。これらのコンテナは ML フレームワークとフレームワークのバージョンで編成され、HTTP 推論サーバーを使用して最小限の構成で推論を行うことができます。多くの場合、推論用の独自のカスタム コンテナを作成するよりも、ビルド済みコンテナを使用するほうが簡単です。
このドキュメントでは、推論用のビルド済みコンテナの一覧を示します。また、Agent Platform のカスタム トレーニング機能を使用して作成したモデル アーティファクトまたは Agent Platform 以外で作成したモデル アーティファクトと一緒に使用する方法を説明します。
サポート ポリシーとスケジュール
Gemini Enterprise Agent Platform は、セキュリティの脆弱性を最小限に抑えるため、スケジュールに基づいて各フレームワーク バージョンをサポートします。サポート ポリシーのスケジュールを確認して、サポートの終了と有効期間の終了がもたらす影響を把握するようにしてください。
使用可能なコンテナ イメージ
次の各コンテナ イメージは、さまざまなロケーションにデータを格納する複数の Artifact Registry リポジトリで利用できます。カスタム トレーニングを行うときは、任意の画像の URI が使用可能であり、各 URI は同じコンテナ イメージを指定しています。 Google Cloud コンソールを使用して Model リソースを作成する場合、 Google Cloud コンソールは、レイテンシを低減するために、Agent Platform を使用しているロケーションに最適な URI を選択します。
TensorFlow
使用可能な TensorFlow コンテナ イメージ(クリックして展開)
| ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | サポートされているイメージ |
|---|---|---|---|---|
| 2.15 | CPU のみ | 2026 年 7 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.15 | GPU(CUDA 12.x) | 2026 年 7 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.14 | CPU のみ | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.14 | GPU(CUDA 12.x) | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.13 | CPU のみ | 2024 年 11 月 28 日 | 2025 年 11 月 28 日 | |
| 2.13 | GPU(CUDA 12.x) | 2024 年 11 月 28 日 | 2025 年 11 月 28 日 | |
| 2.12 | CPU のみ | 2024 年 6 月 30 日 | 2025 年 6 月 30 日 | |
| 2.12 | GPU(CUDA 11.x) | 2024 年 6 月 30 日 | 2025 年 6 月 30 日 | |
| 2.11 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.11 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.10 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.10 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.9 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.9 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.8 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.8 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.7 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.7 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.6 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.6 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.5 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.5 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.4 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.4 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.3 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.3 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.2 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.2 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.1 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.1 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 1.15 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 1.15 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
最適化された TensorFlow ランタイム
次のコンテナ イメージでは、最適化された TensorFlow ランタイムを使用しています。詳細については、最適化された TensorFlow ランタイムを使用するをご覧ください。
使用可能な最適化された TensorFlow ランタイム コンテナ イメージ(クリックして展開)
| ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | サポートされているイメージ |
|---|---|---|---|---|
| ナイトリー | CPU のみ | 該当なし | 該当なし |
|
| ナイトリー | GPU(CUDA 12.x) | 該当なし | 該当なし |
|
| ナイトリー | Cloud TPU | 該当なし | 該当なし |
|
| 2.17 | CPU のみ | 2024 年 7 月 11 日 | 2025 年 7 月 11 日 |
|
| 2.17 | GPU(CUDA 12.x) | 2024 年 7 月 11 日 | 2025 年 7 月 11 日 |
|
| 2.17 | Cloud TPU | 2024 年 7 月 11 日 | 2025 年 7 月 11 日 |
|
| 2.16 | CPU のみ | 2024 年 4 月 26 日 | 2025 年 4 月 26 日 | |
| 2.16 | GPU(CUDA 12.x) | 2024 年 4 月 26 日 | 2025 年 4 月 26 日 | |
| 2.16 | Cloud TPU | 2024 年 4 月 26 日 | 2025 年 4 月 26 日 | |
| 2.15 | CPU のみ | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 | |
| 2.15 | GPU(CUDA 12.x) | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 | |
| 2.15 | Cloud TPU | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 | |
| 2.14 | CPU のみ | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 | |
| 2.14 | GPU(CUDA 12.x) | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 | |
| 2.13 | CPU のみ | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 | |
| 2.13 | GPU(CUDA 11.x) | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 | |
| 2.12 | CPU のみ | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 | |
| 2.12 | GPU(CUDA 11.x) | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 | |
| 2.11 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.11 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.10 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.10 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.9 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.9 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.8 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 2.8 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
PyTorch
使用可能な PyTorch コンテナ イメージ(クリックして展開)
| ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | サポートされているイメージ |
|---|---|---|---|---|
| 2.4(Python 3.9) | CPU のみ | 2026 年 7 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.4(Python 3.9) | GPU(CUDA 12.x) | 2026 年 7 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.4(Python 3.9) | Cloud TPU | 2026 年 7 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.3(Python 3.9) | CPU のみ | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.3(Python 3.9) | GPU(CUDA 12.x) | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.3(Python 3.9) | Cloud TPU | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.2(Python 3.9) | CPU のみ | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.2(Python 3.9) | GPU(CUDA 12.x) | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.2(Python 3.9) | Cloud TPU | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.1(Python 3.9) | CPU のみ | 2024 年 12 月 1 日 | 2025 年 12 月 1 日 | |
| 2.1(Python 3.9) | GPU(CUDA 12.x) | 2024 年 12 月 1 日 | 2025 年 12 月 1 日 | |
| 2.1(Python 3.9) | Cloud TPU | 2024 年 12 月 1 日 | 2025 年 12 月 1 日 | |
| 2.0(Python 3.9) | CPU のみ | 2024 年 7 月 27 日 | 2025 年 7 月 27 日 | |
| 2.0(Python 3.9) | GPU(CUDA 11.x) | 2024 年 7 月 27 日 | 2025 年 7 月 27 日 | |
| 1.13(Python 3.8) | CPU のみ | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 | |
| 1.13(Python 3.8) | GPU(CUDA 11.x) | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 | |
| 1.12 | CPU のみ | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 | |
| 1.12 | GPU(CUDA 11.x) | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 | |
| 1.11 | CPU のみ | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 | |
| 1.11 | GPU(CUDA 11.x) | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 |
scikit-learn
使用可能な scikit-learn コンテナ イメージ(クリックして展開)
| ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | 対応イメージ |
|---|---|---|---|---|
| 1.6(Python 3.10) | CPU のみ | 2026 年 10 月 14 日 | 2027 年 10 月 14 日 |
|
| 1.5(Python 3.10) | CPU のみ | 2026 年 7 月 14 日 | 2027 年 1 月 14 日 |
|
| 1.4(Python 3.10) | CPU のみ | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 1.3(Python 3.10) | CPU のみ | 2024 年 11 月 28 日 | 2025 年 11 月 28 日 | |
| 1.2(Python 3.10) | CPU のみ | 2024 年 6 月 30 日 | 2025 年 6 月 30 日 | |
| 1.0 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 0.24 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 0.23 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 0.22 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 0.20 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
XGBoost
使用可能な XGBoost コンテナ イメージ(クリックして展開)
| ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | サポートされているイメージ |
|---|---|---|---|---|
| 2.1(Python 3.10) | CPU のみ | 2026 年 7 月 14 日 | 2027 年 1 月 14 日 |
|
| 2.0(Python 3.10) | CPU のみ | 2026 年 1 月 14 日 | 2027 年 1 月 14 日 |
|
| 1.7(Python 3.10) | CPU のみ | 2024 年 6 月 30 日 | 2025 年 12 月 30 日 | |
| 1.6 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 1.5 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 1.4 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 1.3 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 1.2 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 1.1 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 0.90 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 | |
| 0.82 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
ビルド済みコンテナを使用する
Model をアップロードするカスタム TrainingPipeline リソースを作成するとき、またはモデル アーティファクトを Model としてインポートするときに、推論用のビルド済みコンテナを指定できます。
これらのビルド済みコンテナのいずれかを使用するには、ビルド済みコンテナの要件に適合する 1 つ以上のモデル アーティファクトとしてモデルを保存する必要があります。詳細については、推論用のモデル アーティファクトのエクスポートをご覧ください。
以下のノートブックでは、ビルド済みコンテナを使用して推論を提供する方法を示します。
| 実行する処理 | ノートブック |
|---|---|
| ビルド済みコンテナを使用して TensorFlow モデルをトレーニングして提供する | カスタム トレーニングとオンライン推論 |
| ビルド済みコンテナを使用して PyTorch モデルを提供する | Agent Platform でビルド済みコンテナを使用して PyTorch モデルを提供する |
| ビルド済みコンテナを使用して Stable Diffusion モデルを提供する | Agent Platform で Stable Diffusion 拡散モデルをデプロイしてホストする |
ノートブック
次のステップ
- エンドポイントにモデルをデプロイして推論を提供する方法を学習する。