Google utilise la technologie IA pour traduire le contenu dans votre langue préférée. Les traductions générées par IA peuvent contenir des erreurs.

Conteneurs préconfigurés pour l'inférence et l'explication

Gemini Enterprise Agent Platform fournit des images de conteneurs Docker que vous exécutez sous forme de conteneurs prédéfinis afin d'inférer des prédictions et d'obtenir des explications à partir des artefacts de modèles entraînés. Ces conteneurs, organisés en fonction du framework de machine learning (ML) et de la version du framework, fournissent des serveurs d'inférence HTTP que vous pouvez utiliser pour diffuser des inférences avec une configuration minimale. Dans de nombreux cas, l'utilisation d'un conteneur prédéfini est plus simple que de créer un conteneur personnalisé pour l'inférence.

Ce document répertorie les conteneurs prédéfinis pour les inférences et les explications. Il explique comment les utiliser avec les artefacts de modèle que vous avez créés à l'aide de la fonctionnalité d'entraînement personnalisé d'Agent Platform ou avec les artefacts de modèle que vous avez créés en dehors d'Agent Platform.

Règles et calendrier de compatibilité

Gemini Enterprise Agent Platform prend en charge chaque version de framework en fonction d'une programmation afin de minimiser les failles de sécurité. Consultez le calendrier de la politique de compatibilité pour comprendre les implications des dates de fin de période de compatibilité et de fin de disponibilité.

Images de conteneurs disponibles

Chacune des images de conteneur suivantes est disponible dans plusieurs dépôts Artifact Registry qui stockent des données dans différents emplacements. Vous pouvez utiliser n'importe quel URI d'une image lorsque vous effectuez un entraînement personnalisé, chacun pointe vers la même image de conteneur. Si vous utilisez la console Google Cloud pour créer une ressource Model, la console Google Cloud sélectionne l'URI qui correspond le mieux à l'emplacement où vous utilisez Agent Platform afin de réduire la latence.

TensorFlow

Images de conteneur TensorFlow disponibles (cliquez pour développer)

Version du framework de ML	Accélérateurs compatibles (et version CUDA, le cas échéant)	Date de fin de correctif et de fin de compatibilité	Fin de disponibilité	Images compatibles
2,15	CPU uniquement	14 juillet 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest`
2,15	GPU (CUDA 12.x)	14 juillet 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest`
2.14	CPU uniquement	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest`
2.14	GPU (CUDA 12.x)	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest`
2,13	CPU uniquement	28 novembre 2024	28 novembre 2025
2,13	GPU (CUDA 12.x)	28 novembre 2024	28 novembre 2025
2.12	CPU uniquement	30 juin 2024	30 juin 2025
2.12	GPU (CUDA 11.x)	30 juin 2024	30 juin 2025
2.11	CPU uniquement	15 novembre 2023	15 novembre 2024
2.11	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.10	CPU uniquement	15 novembre 2023	15 novembre 2024
2.10	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.9	CPU uniquement	15 novembre 2023	15 novembre 2024
2.9	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.8	CPU uniquement	15 novembre 2023	15 novembre 2024
2.8	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.7	CPU uniquement	15 novembre 2023	15 novembre 2024
2.7	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.6	CPU uniquement	15 novembre 2023	15 novembre 2024
2.6	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.5	CPU uniquement	15 novembre 2023	15 novembre 2024
2.5	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.4	CPU uniquement	15 novembre 2023	15 novembre 2024
2.4	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.3	CPU uniquement	15 novembre 2023	15 novembre 2024
2.3	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.2	CPU uniquement	15 novembre 2023	15 novembre 2024
2.2	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.1	CPU uniquement	15 novembre 2023	15 novembre 2024
2.1	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
1.15	CPU uniquement	15 novembre 2023	15 novembre 2024
1.15	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024

Environnement d'exécution TensorFlow optimisé

Les images de conteneur suivantes utilisent l'environnement d'exécution TensorFlow optimisé. Pour en savoir plus, consultez la page Utiliser l'environnement d'exécution TensorFlow optimisé.

Images de conteneurs de l'environnement d'exécution TensorFlow optimisé disponibles (cliquez pour développer)

Version du framework de ML	Accélérateurs compatibles (et version CUDA, le cas échéant)	Date de fin de correctif et de fin de compatibilité	Fin de disponibilité	Images compatibles
nightly	CPU uniquement	Non applicable	Non applicable	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest`
nightly	GPU (CUDA 12.x)	Non applicable	Non applicable	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest`
nightly	Cloud TPU	Non applicable	Non applicable	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest`
2,17	CPU uniquement	11 juillet 2024	11 juillet 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest`
2,17	GPU (CUDA 12.x)	11 juillet 2024	11 juillet 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest`
2,17	Cloud TPU	11 juillet 2024	11 juillet 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest`
2,16	CPU uniquement	26 avril 2024	26 avril 2025
2,16	GPU (CUDA 12.x)	26 avril 2024	26 avril 2025
2,16	Cloud TPU	26 avril 2024	26 avril 2025
2.15	CPU uniquement	15 août 2024	15 août 2025
2.15	GPU (CUDA 12.x)	15 août 2024	15 août 2025
2.15	Cloud TPU	15 août 2024	15 août 2025
2.14	CPU uniquement	15 août 2024	15 août 2025
2.14	GPU (CUDA 12.x)	15 août 2024	15 août 2025
2,13	CPU uniquement	15 août 2024	15 août 2025
2,13	GPU (CUDA 11.x)	15 août 2024	15 août 2025
2.12	CPU uniquement	15 mai 2024	15 mai 2025
2.12	GPU (CUDA 11.x)	15 mai 2024	15 mai 2025
2.11	CPU uniquement	15 novembre 2023	15 novembre 2024
2.11	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.10	CPU uniquement	15 novembre 2023	15 novembre 2024
2.10	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.9	CPU uniquement	15 novembre 2023	15 novembre 2024
2.9	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024
2.8	CPU uniquement	15 novembre 2023	15 novembre 2024
2.8	GPU (CUDA 11.x)	15 novembre 2023	15 novembre 2024

PyTorch

Images de conteneurs PyTorch disponibles (cliquez pour développer)

Version du framework de ML	Accélérateurs compatibles (et version CUDA, le cas échéant)	Date de fin de correctif et de fin de compatibilité	Fin de disponibilité	Images compatibles
2.4 (Python 3.9)	CPU uniquement	14 juillet 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest`
2.4 (Python 3.9)	GPU (CUDA 12.x)	14 juillet 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest`
2.4 (Python 3.9)	Cloud TPU	14 juillet 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest`
2.3 (Python 3.9)	CPU uniquement	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest`
2.3 (Python 3.9)	GPU (CUDA 12.x)	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest`
2.3 (Python 3.9)	Cloud TPU	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest`
2.2 (Python 3.9)	CPU uniquement	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest`
2.2 (Python 3.9)	GPU (CUDA 12.x)	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest`
2.2 (Python 3.9)	Cloud TPU	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest`
2.1 (Python 3.9)	CPU uniquement	1er décembre 2024	1er décembre 2025
2.1 (Python 3.9)	GPU (CUDA 12.x)	1er décembre 2024	1er décembre 2025
2.1 (Python 3.9)	Cloud TPU	1er décembre 2024	1er décembre 2025
2.0 (Python 3.9)	CPU uniquement	27 juillet 2024	27 juillet 2025
2.0 (Python 3.9)	GPU (CUDA 11.x)	27 juillet 2024	27 juillet 2025
1.13 (Python 3.8)	CPU uniquement	15 mai 2024	15 mai 2025
1.13 (Python 3.8)	GPU (CUDA 11.x)	15 mai 2024	15 mai 2025
1.12	CPU uniquement	15 mai 2024	15 mai 2025
1.12	GPU (CUDA 11.x)	15 mai 2024	15 mai 2025
1.11	CPU uniquement	15 mai 2024	15 mai 2025
1.11	GPU (CUDA 11.x)	15 mai 2024	15 mai 2025

scikit-learn

Images de conteneurs scikit-learn disponibles (cliquez pour développer)

Version du framework de ML	Accélérateurs compatibles (et version CUDA, le cas échéant)	Date de fin de correctif et de fin de compatibilité	Fin de disponibilité	Images compatibles
1.6 (Python 3.10)	CPU uniquement	14 octobre 2026	14 octobre 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest`
1.5 (Python 3.10)	CPU uniquement	14 juillet 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest`
1.4 (Python 3.10)	CPU uniquement	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest`
1.3 (Python 3.10)	CPU uniquement	28 novembre 2024	28 novembre 2025
1.2 (Python 3.10)	CPU uniquement	30 juin 2024	30 juin 2025
1.0	CPU uniquement	15 novembre 2023	15 novembre 2024
0.24	CPU uniquement	15 novembre 2023	15 novembre 2024
0.23	CPU uniquement	15 novembre 2023	15 novembre 2024
0.22	CPU uniquement	15 novembre 2023	15 novembre 2024
0,20	CPU uniquement	15 novembre 2023	15 novembre 2024

XGBoost

Images de conteneurs XGBoost disponibles (cliquez pour développer)

Version du framework de ML	Accélérateurs compatibles (et version CUDA, le cas échéant)	Date de fin de correctif et de fin de compatibilité	Fin de disponibilité	Images compatibles
2.1 (Python 3.10)	CPU uniquement	14 juillet 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest` `europe-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest` `asia-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest`
2.0 (Python 3.10)	CPU uniquement	14 janvier 2026	14 janv. 2027	`us-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest` `europe-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest` `asia-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest`
1.7 (Python 3.10)	CPU uniquement	30 juin 2024	30 décembre 2025
1,6	CPU uniquement	15 novembre 2023	15 novembre 2024
1.5	CPU uniquement	15 novembre 2023	15 novembre 2024
1.4	CPU uniquement	15 novembre 2023	15 novembre 2024
1.3	CPU uniquement	15 novembre 2023	15 novembre 2024
1.2	CPU uniquement	15 novembre 2023	15 novembre 2024
1.1	CPU uniquement	15 novembre 2023	15 novembre 2024
0,90	CPU uniquement	15 novembre 2023	15 novembre 2024
0.82	CPU uniquement	15 novembre 2023	15 novembre 2024

Utiliser un conteneur préconfiguré

Vous pouvez spécifier un conteneur prédéfini pour l'inférence lorsque vous créez une ressource TrainingPipeline personnalisée qui importe un fichier Model ou lorsque vous importez des artefacts de modèle en tant que Model.

Pour utiliser l'un de ces conteneurs prédéfinis, vous devez enregistrer votre modèle sous la forme d'un ou de plusieurs artefacts de modèle qui respectent les exigences du conteneur prédéfini. Pour en savoir plus, consultez Exporter des artefacts de modèle pour l'inférence.

Les notebooks suivants montrent comment utiliser un conteneur prédéfini pour diffuser des inférences.

Que souhaitez-vous faire ?	Notebook
Entraîner et diffuser un modèle TensorFlow à l'aide d'un conteneur prédéfini	Entraînement personnalisé et inférence en ligne
Diffuser un modèle PyTorch à l'aide d'un conteneur prédéfini	Diffuser des modèles d'image PyTorch avec des conteneurs prédéfinis sur Agent Platform
Diffuser un modèle de diffusion stable à l'aide d'un conteneur prédéfini	Déployer et héberger un modèle de diffusion stable sur Agent Platform

Notebooks

Étapes suivantes

Découvrez comment déployer un modèle sur un point de terminaison pour diffuser des inférences.