Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Vordefinierte Container für Inferenz und Erläuterungen

Die Gemini Enterprise Agent Platform stellt Docker-Container-Images bereit, die Sie als vordefinierte Container ausführen, um Inferenzvorhersagen und Erläuterungen aus trainierten Modellartefakten bereitzustellen. Diese Container sind nach ML-Framework und Framework-Version organisiert. Sie bieten HTTP-Inferenzserver, mit denen Sie Inferenzanfragen mit minimaler Konfiguration bereitstellen können. In vielen Fällen ist die Verwendung eines vordefinierten Containers einfacher als das Erstellen eines benutzerdefinierten Containers für die Inferenz.

In diesem Dokument sind die vordefinierten Container für Inferenz und Erläuterungen aufgeführt. Außerdem wird darin gezeigt, wie diese mit Modellartefakten verwendet werden, die Sie mit der Funktionalität für benutzerdefiniertes Training von Agent Platform erstellt haben, oder mit Modellartefakten, die Sie außerhalb von Agent Platform angelegt haben.

Supportrichtlinie und ‑zeitplan

Die Gemini Enterprise Agent Platform unterstützt jede Framework-Version basierend auf einem Zeitplan, um Sicherheitslücken zu minimieren. Im Zeitplan für Supportrichtlinien finden Sie Informationen zu den Auswirkungen des Enddatums des Supports und des Endes der Verfügbarkeit.

Verfügbare Container-Images

Jedes der folgenden Container-Images ist in mehreren Artifact Registry-Repositories verfügbar, die Daten an verschiedenen Speicherorten speichern. Sie können jeden der URIs für ein Image verwenden, wenn Sie ein benutzerdefiniertes Training ausführen. Alle URIs stellen dasselbe Container-Image bereit. Wenn Sie mit der Google Cloud Console eine Model-Ressource erstellen, wählt die Google Cloud Console den URI aus, der dem Standort, an dem Sie die Agent Platform verwenden, am nächsten liegt, um die Latenz zu reduzieren.

TensorFlow

Verfügbare TensorFlow-Container-Images (zum Maximieren klicken)

ML-Framework-Version	Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version)	Ende des Patch- und Supportdatums	Ende der Verfügbarkeit	Unterstützte Bilder
2.15	Nur CPU	14. Juli 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest`
2.15	GPU (CUDA 12.x)	14. Juli 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest`
2.14	Nur CPU	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest`
2.14	GPU (CUDA 12.x)	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest`
2,13	Nur CPU	28. Nov. 2024	28. Nov. 2025
2,13	GPU (CUDA 12.x)	28. Nov. 2024	28. Nov. 2025
2,12	Nur CPU	30. Juni 2024	30. Juni 2025
2,12	GPU (CUDA 11.x)	30. Juni 2024	30. Juni 2025
2.11	Nur CPU	15. Nov. 2023	15. Nov. 2024
2.11	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2.10	Nur CPU	15. Nov. 2023	15. Nov. 2024
2.10	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2,9	Nur CPU	15. Nov. 2023	15. Nov. 2024
2,9	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2,8	Nur CPU	15. Nov. 2023	15. Nov. 2024
2,8	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2.7	Nur CPU	15. Nov. 2023	15. Nov. 2024
2.7	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2,6	Nur CPU	15. Nov. 2023	15. Nov. 2024
2,6	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2,5	Nur CPU	15. Nov. 2023	15. Nov. 2024
2,5	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2.4	Nur CPU	15. Nov. 2023	15. Nov. 2024
2.4	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2,3	Nur CPU	15. Nov. 2023	15. Nov. 2024
2,3	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2.2	Nur CPU	15. Nov. 2023	15. Nov. 2024
2.2	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2.1	Nur CPU	15. Nov. 2023	15. Nov. 2024
2.1	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
1.15	Nur CPU	15. Nov. 2023	15. Nov. 2024
1.15	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024

Optimierte TensorFlow-Laufzeit

Die folgenden Container-Images verwenden die optimierte TensorFlow-Laufzeit. Weitere Informationen finden Sie unter Optimierte TensorFlow-Laufzeit verwenden.

Verfügbare optimierte TensorFlow-Laufzeitcontainer-Images (zum Maximieren klicken)

ML-Framework-Version	Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version)	Ende des Patch- und Supportdatums	Ende der Verfügbarkeit	Unterstützte Bilder
nächtlich	Nur CPU	Nicht zutreffend	Nicht zutreffend	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest`
nächtlich	GPU (CUDA 12.x)	Nicht zutreffend	Nicht zutreffend	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest`
nächtlich	Cloud TPU	Nicht zutreffend	Nicht zutreffend	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest`
2,17	Nur CPU	11. Juli 2024	11. Juli 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest`
2,17	GPU (CUDA 12.x)	11. Juli 2024	11. Juli 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest`
2,17	Cloud TPU	11. Juli 2024	11. Juli 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest`
2,16	Nur CPU	26. Apr. 2024	26. Apr. 2025
2,16	GPU (CUDA 12.x)	26. Apr. 2024	26. Apr. 2025
2,16	Cloud TPU	26. Apr. 2024	26. Apr. 2025
2.15	Nur CPU	15. Aug. 2024	15. Aug. 2025
2.15	GPU (CUDA 12.x)	15. Aug. 2024	15. Aug. 2025
2.15	Cloud TPU	15. Aug. 2024	15. Aug. 2025
2.14	Nur CPU	15. Aug. 2024	15. Aug. 2025
2.14	GPU (CUDA 12.x)	15. Aug. 2024	15. Aug. 2025
2,13	Nur CPU	15. Aug. 2024	15. Aug. 2025
2,13	GPU (CUDA 11.x)	15. Aug. 2024	15. Aug. 2025
2,12	Nur CPU	15. Mai 2024	15. Mai 2025
2,12	GPU (CUDA 11.x)	15. Mai 2024	15. Mai 2025
2.11	Nur CPU	15. Nov. 2023	15. Nov. 2024
2.11	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2.10	Nur CPU	15. Nov. 2023	15. Nov. 2024
2.10	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2,9	Nur CPU	15. Nov. 2023	15. Nov. 2024
2,9	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024
2,8	Nur CPU	15. Nov. 2023	15. Nov. 2024
2,8	GPU (CUDA 11.x)	15. Nov. 2023	15. Nov. 2024

PyTorch

Verfügbare PyTorch-Container-Images (zum Maximieren klicken)

ML-Framework-Version	Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version)	Ende des Patch- und Supportdatums	Ende der Verfügbarkeit	Unterstützte Bilder
2.4 (Python 3.9)	Nur CPU	14. Juli 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest`
2.4 (Python 3.9)	GPU (CUDA 12.x)	14. Juli 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest`
2.4 (Python 3.9)	Cloud TPU	14. Juli 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest`
2.3 (Python 3.9)	Nur CPU	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest`
2.3 (Python 3.9)	GPU (CUDA 12.x)	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest`
2.3 (Python 3.9)	Cloud TPU	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest`
2.2 (Python 3.9)	Nur CPU	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest`
2.2 (Python 3.9)	GPU (CUDA 12.x)	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest`
2.2 (Python 3.9)	Cloud TPU	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest`
2.1 (Python 3.9)	Nur CPU	01. Dez. 2024	01. Dez. 2025
2.1 (Python 3.9)	GPU (CUDA 12.x)	01. Dez. 2024	01. Dez. 2025
2.1 (Python 3.9)	Cloud TPU	01. Dez. 2024	01. Dez. 2025
2.0 (Python 3.9)	Nur CPU	27. Juli 2024	27. Juli 2025
2.0 (Python 3.9)	GPU (CUDA 11.x)	27. Juli 2024	27. Juli 2025
1.13 (Python 3.8)	Nur CPU	15. Mai 2024	15. Mai 2025
1.13 (Python 3.8)	GPU (CUDA 11.x)	15. Mai 2024	15. Mai 2025
1.12	Nur CPU	15. Mai 2024	15. Mai 2025
1.12	GPU (CUDA 11.x)	15. Mai 2024	15. Mai 2025
1.11	Nur CPU	15. Mai 2024	15. Mai 2025
1.11	GPU (CUDA 11.x)	15. Mai 2024	15. Mai 2025

scikit-learn

Verfügbare scikit-learn-Container-Images (zum Maximieren anklicken)

ML-Framework-Version	Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version)	Ende des Patch- und Supportdatums	Ende der Verfügbarkeit	Unterstützte Bilder
1.6 (Python 3.10)	Nur CPU	14. Okt. 2026	14. Oktober 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest`
1.5 (Python 3.10)	Nur CPU	14. Juli 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest`
1.4 (Python 3.10)	Nur CPU	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest`
1.3 (Python 3.10)	Nur CPU	28. Nov. 2024	28. Nov. 2025
1.2 (Python 3.10)	Nur CPU	30. Juni 2024	30. Juni 2025
1,0	Nur CPU	15. Nov. 2023	15. Nov. 2024
0,24	Nur CPU	15. Nov. 2023	15. Nov. 2024
0.23	Nur CPU	15. Nov. 2023	15. Nov. 2024
0.22	Nur CPU	15. Nov. 2023	15. Nov. 2024
0,20	Nur CPU	15. Nov. 2023	15. Nov. 2024

XGBoost

Verfügbare XGBoost-Container-Images (zum Maximieren klicken)

ML-Framework-Version	Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version)	Ende des Patch- und Supportdatums	Ende der Verfügbarkeit	Unterstützte Bilder
2.1 (Python 3.10)	Nur CPU	14. Juli 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest` `europe-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest` `asia-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest`
2.0 (Python 3.10)	Nur CPU	14. Januar 2026	14. Januar 2027	`us-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest` `europe-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest` `asia-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest`
1.7 (Python 3.10)	Nur CPU	30. Juni 2024	30. Dezember 2025
1,6	Nur CPU	15. Nov. 2023	15. Nov. 2024
1,5	Nur CPU	15. Nov. 2023	15. Nov. 2024
1.4	Nur CPU	15. Nov. 2023	15. Nov. 2024
1.3	Nur CPU	15. Nov. 2023	15. Nov. 2024
1.2	Nur CPU	15. Nov. 2023	15. Nov. 2024
1.1	Nur CPU	15. Nov. 2023	15. Nov. 2024
0,90 $	Nur CPU	15. Nov. 2023	15. Nov. 2024
0,82	Nur CPU	15. Nov. 2023	15. Nov. 2024

Vordefinierten Container verwenden

Sie können einen vordefinierten Container für die Inferenz angeben, wenn Sie eine benutzerdefinierte TrainingPipeline-Ressource erstellen, die ein Model hochlädt, oder wenn Sie Modellartefakte als Model importieren.

Wenn Sie einen dieser vordefinierten Container verwenden möchten, müssen Sie das Modell als ein oder mehrere Modellartefakte speichern, die den Anforderungen des vordefinierten Containers entsprechen. Weitere Informationen finden Sie unter Modellartefakte für die Inferenz exportieren.

In folgenden Notebooks wird gezeigt, wie ein vordefinierter Container zur Bereitstellung von Inferenzen verwendet wird.

Was möchten Sie tun?	Notizbuch
TensorFlow-Modell mit einem vordefinierten Container trainieren und bereitstellen	Benutzerdefiniertes Training und Onlineinferenz
PyTorch-Modell mit einem vordefinierten Container bereitstellen	PyTorch-Bildmodelle mit vordefinierten Containern auf der Agent Platform bereitstellen
Stable Diffusion-Modell mit einem vordefinierten Container bereitstellen	Stable Diffusion-Modell auf der Agent Platform bereitstellen und hosten

Notebooks

Nächste Schritte

Informationen zum Bereitstellen eines Modells auf einem Endpunkt, um Inferenzen zu verarbeiten.