Vertex AI stellt Docker-Container-Images bereit, die Sie als vordefinierte Container ausführen, um Inferenzanfragen und Erläuterungen aus trainierten Modellartefakten bereitzustellen. Diese Container sind nach ML-Framework und Framework-Version organisiert. Sie bieten HTTP-Inferenzserver, mit denen Sie Inferenzanfragen mit minimaler Konfiguration bereitstellen können. In vielen Fällen ist die Verwendung eines vordefinierten Containers einfacher als das Erstellen eines benutzerdefinierten Containers für die Inferenz.
In diesem Dokument sind die vordefinierten Container für Inferenz und Erläuterungen aufgeführt. Außerdem wird darin gezeigt, wie diese mit Modellartefakten verwendet werden, die Sie mit der Funktionalität für benutzerdefiniertes Training von Vertex AI erstellt haben, oder mit Modellartefakten, die Sie außerhalb von Vertex AI angelegt haben.
Supportrichtlinie und ‑zeitplan
Vertex AI unterstützt jede Framework-Version basierend auf einem Zeitplan, um Sicherheitslücken zu minimieren. Im Zeitplan für Supportrichtlinien finden Sie Informationen zu den Auswirkungen des Enddatums des Supports und des Endes der Verfügbarkeit.
Verfügbare Container-Images
Jedes der folgenden Container-Images ist in mehreren Artifact Registry-Repositories verfügbar, die Daten an verschiedenen Speicherorten speichern. Sie können jeden der URIs für ein Image verwenden, wenn Sie ein benutzerdefiniertes Training ausführen. Alle URIs stellen dasselbe Container-Image bereit. Wenn Sie mit der Google Cloud Console eine Model-Ressource erstellen, wählt die Google Cloud Console zum Reduzieren der Latenz den URI aus, der dem Standort, an dem Sie Vertex AI verwenden, am nächsten liegt.
TensorFlow
Verfügbare TensorFlow-Container-Images (zum Maximieren klicken)
| ML-Framework-Version | Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version) | Ende des Patch- und Supportdatums | Ende der Verfügbarkeit | Unterstützte Bilder |
|---|---|---|---|---|
| 2.15 | Nur CPU | 14. Juli 2026 | 14. Januar 2027 |
|
| 2.15 | GPU (CUDA 12.x) | 14. Juli 2026 | 14. Januar 2027 |
|
| 2.14 | Nur CPU | 14. Januar 2026 | 14. Januar 2027 |
|
| 2.14 | GPU (CUDA 12.x) | 14. Januar 2026 | 14. Januar 2027 |
|
| 2,13 | Nur CPU | 28. Nov. 2024 | 28. Nov. 2025 | |
| 2,13 | GPU (CUDA 12.x) | 28. Nov. 2024 | 28. Nov. 2025 | |
| 2,12 | Nur CPU | 30. Juni 2024 | 30. Juni 2025 | |
| 2,12 | GPU (CUDA 11.x) | 30. Juni 2024 | 30. Juni 2025 | |
| 2.11 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.10 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,9 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,9 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,8 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,8 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.7 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.7 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,6 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,6 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,5 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,5 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.4 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.4 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,3 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,3 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.2 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.2 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.1 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.1 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 1.15 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 1.15 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 |
Optimierte TensorFlow-Laufzeit
Die folgenden Container-Images verwenden die optimierte TensorFlow-Laufzeit. Weitere Informationen finden Sie unter Optimierte TensorFlow-Laufzeit verwenden.
Verfügbare optimierte TensorFlow-Laufzeitcontainer-Images (zum Maximieren klicken)
| ML-Framework-Version | Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version) | Ende des Patch- und Supportdatums | Ende der Verfügbarkeit | Unterstützte Bilder |
|---|---|---|---|---|
| nächtlich | Nur CPU | Nicht zutreffend | Nicht zutreffend |
|
| nächtlich | GPU (CUDA 12.x) | Nicht zutreffend | Nicht zutreffend |
|
| nächtlich | Cloud TPU | Nicht zutreffend | Nicht zutreffend |
|
| 2,17 | Nur CPU | 11. Juli 2024 | 11. Juli 2025 |
|
| 2,17 | GPU (CUDA 12.x) | 11. Juli 2024 | 11. Juli 2025 |
|
| 2,17 | Cloud TPU | 11. Juli 2024 | 11. Juli 2025 |
|
| 2,16 | Nur CPU | 26. Apr. 2024 | 26. Apr. 2025 | |
| 2,16 | GPU (CUDA 12.x) | 26. Apr. 2024 | 26. Apr. 2025 | |
| 2,16 | Cloud TPU | 26. Apr. 2024 | 26. Apr. 2025 | |
| 2.15 | Nur CPU | 15. Aug. 2024 | 15. Aug. 2025 | |
| 2.15 | GPU (CUDA 12.x) | 15. Aug. 2024 | 15. Aug. 2025 | |
| 2.15 | Cloud TPU | 15. Aug. 2024 | 15. Aug. 2025 | |
| 2.14 | Nur CPU | 15. Aug. 2024 | 15. Aug. 2025 | |
| 2.14 | GPU (CUDA 12.x) | 15. Aug. 2024 | 15. Aug. 2025 | |
| 2,13 | Nur CPU | 15. Aug. 2024 | 15. Aug. 2025 | |
| 2,13 | GPU (CUDA 11.x) | 15. Aug. 2024 | 15. Aug. 2025 | |
| 2,12 | Nur CPU | 15. Mai 2024 | 15. Mai 2025 | |
| 2,12 | GPU (CUDA 11.x) | 15. Mai 2024 | 15. Mai 2025 | |
| 2.11 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.10 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,9 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,9 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,8 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 2,8 | GPU (CUDA 11.x) | 15. Nov. 2023 | 15. Nov. 2024 |
PyTorch
Verfügbare PyTorch-Container-Images (zum Maximieren klicken)
| ML-Framework-Version | Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version) | Ende des Patch- und Supportdatums | Ende der Verfügbarkeit | Unterstützte Bilder |
|---|---|---|---|---|
| 2.4 (Python 3.9) | Nur CPU | 14. Juli 2026 | 14. Januar 2027 |
|
| 2.4 (Python 3.9) | GPU (CUDA 12.x) | 14. Juli 2026 | 14. Januar 2027 |
|
| 2.4 (Python 3.9) | Cloud TPU | 14. Juli 2026 | 14. Januar 2027 |
|
| 2.3 (Python 3.9) | Nur CPU | 14. Januar 2026 | 14. Januar 2027 |
|
| 2.3 (Python 3.9) | GPU (CUDA 12.x) | 14. Januar 2026 | 14. Januar 2027 |
|
| 2.3 (Python 3.9) | Cloud TPU | 14. Januar 2026 | 14. Januar 2027 |
|
| 2.2 (Python 3.9) | Nur CPU | 14. Januar 2026 | 14. Januar 2027 |
|
| 2.2 (Python 3.9) | GPU (CUDA 12.x) | 14. Januar 2026 | 14. Januar 2027 |
|
| 2.2 (Python 3.9) | Cloud TPU | 14. Januar 2026 | 14. Januar 2027 |
|
| 2.1 (Python 3.9) | Nur CPU | 01. Dez. 2024 | 01. Dez. 2025 | |
| 2.1 (Python 3.9) | GPU (CUDA 12.x) | 01. Dez. 2024 | 01. Dez. 2025 | |
| 2.1 (Python 3.9) | Cloud TPU | 01. Dez. 2024 | 01. Dez. 2025 | |
| 2.0 (Python 3.9) | Nur CPU | 27. Juli 2024 | 27. Juli 2025 | |
| 2.0 (Python 3.9) | GPU (CUDA 11.x) | 27. Juli 2024 | 27. Juli 2025 | |
| 1.13 (Python 3.8) | Nur CPU | 15. Mai 2024 | 15. Mai 2025 | |
| 1.13 (Python 3.8) | GPU (CUDA 11.x) | 15. Mai 2024 | 15. Mai 2025 | |
| 1.12 | Nur CPU | 15. Mai 2024 | 15. Mai 2025 | |
| 1.12 | GPU (CUDA 11.x) | 15. Mai 2024 | 15. Mai 2025 | |
| 1.11 | Nur CPU | 15. Mai 2024 | 15. Mai 2025 | |
| 1.11 | GPU (CUDA 11.x) | 15. Mai 2024 | 15. Mai 2025 |
scikit-learn
Verfügbare scikit-learn-Container-Images (zum Maximieren klicken)
| ML-Framework-Version | Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version) | Ende des Patch- und Supportdatums | Ende der Verfügbarkeit | Unterstützte Bilder |
|---|---|---|---|---|
| 1.6 (Python 3.10) | Nur CPU | 14. Okt. 2026 | 14. Oktober 2027 |
|
| 1.5 (Python 3.10) | Nur CPU | 14. Juli 2026 | 14. Januar 2027 |
|
| 1.4 (Python 3.10) | Nur CPU | 14. Januar 2026 | 14. Januar 2027 |
|
| 1.3 (Python 3.10) | Nur CPU | 28. Nov. 2024 | 28. Nov. 2025 | |
| 1.2 (Python 3.10) | Nur CPU | 30. Juni 2024 | 30. Juni 2025 | |
| 1,0 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 0,24 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 0.23 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 0.22 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 0,20 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 |
XGBoost
Verfügbare XGBoost-Container-Images (zum Maximieren klicken)
| ML-Framework-Version | Unterstützte Beschleuniger (und gegebenenfalls CUDA-Version) | Ende des Patch- und Supportdatums | Ende der Verfügbarkeit | Unterstützte Bilder |
|---|---|---|---|---|
| 2.1 (Python 3.10) | Nur CPU | 14. Juli 2026 | 14. Januar 2027 |
|
| 2.0 (Python 3.10) | Nur CPU | 14. Januar 2026 | 14. Januar 2027 |
|
| 1.7 (Python 3.10) | Nur CPU | 30. Juni 2024 | 30. Dezember 2025 | |
| 1,6 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 1,5 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 1.4 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 1.3 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 1.2 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 1.1 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 0,90 $ | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 | |
| 0,82 | Nur CPU | 15. Nov. 2023 | 15. Nov. 2024 |
Vordefinierten Container verwenden
Sie können einen vordefinierten Container für die Inferenz angeben, wenn Sie eine benutzerdefinierte TrainingPipeline-Ressource erstellen, die ein Model hochlädt, oder wenn Sie Modellartefakte als Model importieren.
Wenn Sie einen dieser vordefinierten Container verwenden möchten, müssen Sie das Modell als ein oder mehrere Modellartefakte speichern, die den Anforderungen des vordefinierten Containers entsprechen. Weitere Informationen finden Sie unter Modellartefakte für die Inferenz exportieren.
In folgenden Notebooks wird gezeigt, wie ein vordefinierter Container zur Bereitstellung von Inferenzen verwendet wird.
| Was möchten Sie tun? | Notizbuch |
|---|---|
| TensorFlow-Modell mit einem vordefinierten Container trainieren und bereitstellen | Benutzerdefiniertes Training und Onlineinferenz |
| PyTorch-Modell mit einem vordefinierten Container bereitstellen | PyTorch-Image-Modelle mit vordefinierten Containern in Vertex AI bereitstellen |
| Stable Diffusion-Modell mit einem vordefinierten Container bereitstellen | Stable Diffusion-Modell in Vertex AI bereitstellen und hosten |