Vertex AI fournit des images de conteneurs Docker que vous exécutez sous forme de conteneurs prédéfinis afin d'inférer des prédictions et d'obtenir des explications à partir des artefacts de modèles entraînés. Ces conteneurs, organisés en fonction du framework de machine learning (ML) et de la version du framework, fournissent des serveurs d'inférence HTTP que vous pouvez utiliser pour diffuser des inférences avec une configuration minimale. Dans de nombreux cas, l'utilisation d'un conteneur prédéfini est plus simple que de créer un conteneur personnalisé pour l'inférence.
Ce document répertorie les conteneurs préconfigurés pour les inférences et les explications. Il explique comment les utiliser avec les artefacts de modèle que vous avez créés à l'aide de la fonctionnalité d'entraînement personnalisé de Vertex AI ou avec les artefacts de modèle que vous avez créés en dehors de Vertex AI.
Règles et calendrier de compatibilité
Vertex AI prend en charge chaque version de framework en fonction d'une programmation afin de minimiser les failles de sécurité. Consultez le calendrier de la politique de compatibilité pour comprendre les implications des dates de fin de période de compatibilité et de fin de disponibilité.
Images de conteneurs disponibles
Chacune des images de conteneur suivantes est disponible dans plusieurs dépôts Artifact Registry qui stockent des données dans différents emplacements. Vous pouvez utiliser n'importe quel URI d'une image lorsque vous effectuez un entraînement personnalisé, chacun pointe vers la même image de conteneur. Si vous utilisez la console Google Cloud pour créer une ressource Model, la console Google Cloud sélectionne l'URI qui correspond le mieux à l'emplacement où vous utilisez Vertex AI afin de réduire la latence.
TensorFlow
Images de conteneur TensorFlow disponibles (cliquez pour développer)
| Version du framework de ML | Accélérateurs compatibles (et version CUDA, le cas échéant) | Date de fin de correctif et de fin de compatibilité | Fin de disponibilité | Images compatibles |
|---|---|---|---|---|
| 2,15 | CPU uniquement | 14 juillet 2026 | 14 janv. 2027 |
|
| 2,15 | GPU (CUDA 12.x) | 14 juillet 2026 | 14 janv. 2027 |
|
| 2.14 | CPU uniquement | 14 janvier 2026 | 14 janv. 2027 |
|
| 2.14 | GPU (CUDA 12.x) | 14 janvier 2026 | 14 janv. 2027 |
|
| 2,13 | CPU uniquement | 28 novembre 2024 | 28 novembre 2025 | |
| 2,13 | GPU (CUDA 12.x) | 28 novembre 2024 | 28 novembre 2025 | |
| 2.12 | CPU uniquement | 30 juin 2024 | 30 juin 2025 | |
| 2.12 | GPU (CUDA 11.x) | 30 juin 2024 | 30 juin 2025 | |
| 2.11 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.10 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.9 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.9 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.8 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.8 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.7 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.7 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.6 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.6 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.5 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.5 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.4 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.4 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.3 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.3 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.2 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.2 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.1 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.1 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 1.15 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 1.15 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 |
Environnement d'exécution TensorFlow optimisé
Les images de conteneur suivantes utilisent l'environnement d'exécution TensorFlow optimisé. Pour en savoir plus, consultez la page Utiliser l'environnement d'exécution TensorFlow optimisé.
Images de conteneurs de l'environnement d'exécution TensorFlow optimisé disponibles (cliquez pour développer)
| Version du framework de ML | Accélérateurs compatibles (et version CUDA, le cas échéant) | Date de fin de correctif et de fin de compatibilité | Fin de disponibilité | Images compatibles |
|---|---|---|---|---|
| nightly | CPU uniquement | Non applicable | Non applicable |
|
| nightly | GPU (CUDA 12.x) | Non applicable | Non applicable |
|
| nightly | Cloud TPU | Non applicable | Non applicable |
|
| 2,17 | CPU uniquement | 11 juillet 2024 | 11 juillet 2025 |
|
| 2,17 | GPU (CUDA 12.x) | 11 juillet 2024 | 11 juillet 2025 |
|
| 2,17 | Cloud TPU | 11 juillet 2024 | 11 juillet 2025 |
|
| 2,16 | CPU uniquement | 26 avril 2024 | 26 avril 2025 | |
| 2,16 | GPU (CUDA 12.x) | 26 avril 2024 | 26 avril 2025 | |
| 2,16 | Cloud TPU | 26 avril 2024 | 26 avril 2025 | |
| 2.15 | CPU uniquement | 15 août 2024 | 15 août 2025 | |
| 2.15 | GPU (CUDA 12.x) | 15 août 2024 | 15 août 2025 | |
| 2.15 | Cloud TPU | 15 août 2024 | 15 août 2025 | |
| 2.14 | CPU uniquement | 15 août 2024 | 15 août 2025 | |
| 2.14 | GPU (CUDA 12.x) | 15 août 2024 | 15 août 2025 | |
| 2,13 | CPU uniquement | 15 août 2024 | 15 août 2025 | |
| 2,13 | GPU (CUDA 11.x) | 15 août 2024 | 15 août 2025 | |
| 2.12 | CPU uniquement | 15 mai 2024 | 15 mai 2025 | |
| 2.12 | GPU (CUDA 11.x) | 15 mai 2024 | 15 mai 2025 | |
| 2.11 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.10 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.9 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.9 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 | |
| 2.8 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 2.8 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 novembre 2024 |
PyTorch
Images de conteneurs PyTorch disponibles (cliquez pour développer)
| Version du framework de ML | Accélérateurs compatibles (et version CUDA, le cas échéant) | Date de fin de correctif et de fin de compatibilité | Fin de disponibilité | Images compatibles |
|---|---|---|---|---|
| 2.4 (Python 3.9) | CPU uniquement | 14 juillet 2026 | 14 janv. 2027 |
|
| 2.4 (Python 3.9) | GPU (CUDA 12.x) | 14 juillet 2026 | 14 janv. 2027 |
|
| 2.4 (Python 3.9) | Cloud TPU | 14 juillet 2026 | 14 janv. 2027 |
|
| 2.3 (Python 3.9) | CPU uniquement | 14 janvier 2026 | 14 janv. 2027 |
|
| 2.3 (Python 3.9) | GPU (CUDA 12.x) | 14 janvier 2026 | 14 janv. 2027 |
|
| 2.3 (Python 3.9) | Cloud TPU | 14 janvier 2026 | 14 janv. 2027 |
|
| 2.2 (Python 3.9) | CPU uniquement | 14 janvier 2026 | 14 janv. 2027 |
|
| 2.2 (Python 3.9) | GPU (CUDA 12.x) | 14 janvier 2026 | 14 janv. 2027 |
|
| 2.2 (Python 3.9) | Cloud TPU | 14 janvier 2026 | 14 janv. 2027 |
|
| 2.1 (Python 3.9) | CPU uniquement | 1er décembre 2024 | 1er décembre 2025 | |
| 2.1 (Python 3.9) | GPU (CUDA 12.x) | 1er décembre 2024 | 1er décembre 2025 | |
| 2.1 (Python 3.9) | Cloud TPU | 1er décembre 2024 | 1er décembre 2025 | |
| 2.0 (Python 3.9) | CPU uniquement | 27 juillet 2024 | 27 juillet 2025 | |
| 2.0 (Python 3.9) | GPU (CUDA 11.x) | 27 juillet 2024 | 27 juillet 2025 | |
| 1.13 (Python 3.8) | CPU uniquement | 15 mai 2024 | 15 mai 2025 | |
| 1.13 (Python 3.8) | GPU (CUDA 11.x) | 15 mai 2024 | 15 mai 2025 | |
| 1.12 | CPU uniquement | 15 mai 2024 | 15 mai 2025 | |
| 1.12 | GPU (CUDA 11.x) | 15 mai 2024 | 15 mai 2025 | |
| 1.11 | CPU uniquement | 15 mai 2024 | 15 mai 2025 | |
| 1.11 | GPU (CUDA 11.x) | 15 mai 2024 | 15 mai 2025 |
scikit-learn
Images de conteneurs scikit-learn disponibles (cliquez pour développer)
| Version du framework de ML | Accélérateurs compatibles (et version CUDA, le cas échéant) | Date de fin de correctif et de fin de compatibilité | Fin de disponibilité | Images compatibles |
|---|---|---|---|---|
| 1.6 (Python 3.10) | CPU uniquement | 14 octobre 2026 | 14 octobre 2027 |
|
| 1.5 (Python 3.10) | CPU uniquement | 14 juillet 2026 | 14 janv. 2027 |
|
| 1.4 (Python 3.10) | CPU uniquement | 14 janvier 2026 | 14 janv. 2027 |
|
| 1.3 (Python 3.10) | CPU uniquement | 28 novembre 2024 | 28 novembre 2025 | |
| 1.2 (Python 3.10) | CPU uniquement | 30 juin 2024 | 30 juin 2025 | |
| 1.0 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 0.24 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 0.23 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 0.22 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 0,20 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 |
XGBoost
Images de conteneurs XGBoost disponibles (cliquez pour développer)
| Version du framework de ML | Accélérateurs compatibles (et version CUDA, le cas échéant) | Date de fin de correctif et de fin de compatibilité | Fin de disponibilité | Images compatibles |
|---|---|---|---|---|
| 2.1 (Python 3.10) | CPU uniquement | 14 juillet 2026 | 14 janv. 2027 |
|
| 2.0 (Python 3.10) | CPU uniquement | 14 janvier 2026 | 14 janv. 2027 |
|
| 1.7 (Python 3.10) | CPU uniquement | 30 juin 2024 | 30 décembre 2025 | |
| 1,6 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 1.5 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 1.4 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 1.3 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 1.2 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 1.1 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 0,90 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 | |
| 0.82 | CPU uniquement | 15 novembre 2023 | 15 novembre 2024 |
Utiliser un conteneur préconfiguré
Vous pouvez spécifier un conteneur prédéfini pour l'inférence lorsque vous créez une ressource TrainingPipeline personnalisée qui importe un fichier Model ou lorsque vous importez des artefacts de modèle en tant que Model.
Pour utiliser l'un de ces conteneurs prédéfinis, vous devez enregistrer votre modèle sous la forme d'un ou de plusieurs artefacts de modèle qui respectent les exigences du conteneur prédéfini. Pour en savoir plus, consultez Exporter des artefacts de modèle pour l'inférence.
Les notebooks suivants montrent comment utiliser un conteneur prédéfini pour diffuser des inférences.
| Que souhaitez-vous faire ? | Notebook |
|---|---|
| Entraîner et diffuser un modèle TensorFlow à l'aide d'un conteneur prédéfini | Entraînement personnalisé et inférence en ligne |
| Diffuser un modèle PyTorch à l'aide d'un conteneur prédéfini | Diffuser des modèles d'image PyTorch avec des conteneurs prédéfinis sur Vertex AI |
| Diffuser un modèle de diffusion stable à l'aide d'un conteneur prédéfini | Déployer et héberger un modèle de diffusion stable sur Vertex AI |
Notebooks
Étapes suivantes
- Découvrez comment déployer un modèle sur un point de terminaison pour diffuser des inférences.