Vertex AI proporciona imágenes de contenedor de Docker que se ejecutan como contenedores precompilados para entregar inferencias y explicaciones a partir de artefactos de modelos entrenados. Estos contenedores, organizados por framework de aprendizaje automático (AA) y versión de framework, proporcionan servidores de inferencia HTTP que puedes usar para entregar inferencias con una configuración mínima. En muchos casos, usar un contenedor precompilado es más sencillo que crear tu propio contenedor personalizado para la inferencia.
En este documento, se enumeran los contenedores compilados previamente para las inferencias y explicaciones y se describe cómo usarlos con artefactos de modelo que creaste con la función de entrenamiento personalizado de Vertex AI o artefactos de modelo que creaste fuera de Vertex AI.
Política y programa de asistencia
Vertex AI admite cada versión de framework según un programa para minimizar las vulnerabilidades de seguridad. Revisa el Programa de la política de asistencia para comprender las implicaciones de las fechas de finalización de la asistencia y de finalización de la disponibilidad.
Imágenes de contenedor disponibles
Cada una de las siguientes imágenes de contenedor está disponible en varios repositorios de Artifact Registry, que almacenan datos en varias ubicaciones. Puedes usar cualquiera de los URI de una imagen cuando realices un entrenamiento personalizado; cada uno proporciona la misma imagen de contenedor. Si usas la consola de Google Cloud para crear un recurso deModel, la consola de Google Cloud selecciona el URI que mejor coincide con la ubicación en la que usas Vertex AI para reducir la latencia.
TensorFlow
Imágenes de contenedor de TensorFlow disponibles (haz clic para expandir)
| Versión del marco de trabajo de AA | Aceleradores compatibles (y la versión de CUDA, si corresponde) | Fecha de finalización del parche y la compatibilidad | Fin de la disponibilidad | Imágenes compatibles |
|---|---|---|---|---|
| 2.15 | Solo CPU | 14 de julio de 2026 | 14 de enero de 2027 |
|
| 2.15 | GPU (CUDA 12.x) | 14 de julio de 2026 | 14 de enero de 2027 |
|
| 2.14 | Solo CPU | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 2.14 | GPU (CUDA 12.x) | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 2.13 | Solo CPU | 28 nov 2024 | 28 nov 2025 | |
| 2.13 | GPU (CUDA 12.x) | 28 nov 2024 | 28 nov 2025 | |
| 2.12 | Solo CPU | 30 de junio de 2024 | 30 Junio de 2025 | |
| 2.12 | GPU (CUDA 11.x) | 30 de junio de 2024 | 30 Junio de 2025 | |
| 2.11 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.10 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.9 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.9 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.8 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.8 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.7 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.7 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.6 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.6 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.5 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.5 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.4 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.4 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.3 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.3 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.2 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.2 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.1 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.1 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 1.15 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 1.15 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 |
Entorno de ejecución optimizado de TensorFlow
Las siguientes imágenes de contenedor usan el entorno de ejecución optimizado de TensorFlow. Para obtener más información, consulta Usa el entorno de ejecución optimizado de TensorFlow.
Imágenes de contenedor del entorno de ejecución optimizado de TensorFlow disponibles (haz clic para expandir)
| Versión del marco de trabajo de AA | Aceleradores compatibles (y la versión de CUDA, si corresponde) | Fecha de finalización del parche y la compatibilidad | Fin de la disponibilidad | Imágenes compatibles |
|---|---|---|---|---|
| Por noche | Solo CPU | No aplicable | No aplicable |
|
| Por noche | GPU (CUDA 12.x) | No aplicable | No aplicable |
|
| Por noche | Cloud TPU | No aplicable | No aplicable |
|
| 2.17 | Solo CPU | 11 de julio de 2024 | 11 de julio de 2025 |
|
| 2.17 | GPU (CUDA 12.x) | 11 de julio de 2024 | 11 de julio de 2025 |
|
| 2.17 | Cloud TPU | 11 de julio de 2024 | 11 de julio de 2025 |
|
| 2.16 | Solo CPU | 26 de abril de 2024 | 26 de abril de 2025 | |
| 2.16 | GPU (CUDA 12.x) | 26 de abril de 2024 | 26 de abril de 2025 | |
| 2.16 | Cloud TPU | 26 de abril de 2024 | 26 de abril de 2025 | |
| 2.15 | Solo CPU | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.15 | GPU (CUDA 12.x) | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.15 | Cloud TPU | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.14 | Solo CPU | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.14 | GPU (CUDA 12.x) | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.13 | Solo CPU | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.13 | GPU (CUDA 11.x) | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.12 | Solo CPU | 15 de mayo de 2024 | 15 de mayo de 2025 | |
| 2.12 | GPU (CUDA 11.x) | 15 de mayo de 2024 | 15 de mayo de 2025 | |
| 2.11 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.10 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.9 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.9 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.8 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 2.8 | GPU (CUDA 11.x) | 15 de noviembre de 2023 | 15 de noviembre de 2024 |
PyTorch
Imágenes de contenedor de PyTorch disponibles (haz clic para expandir)
| Versión del marco de trabajo de AA | Aceleradores compatibles (y la versión de CUDA, si corresponde) | Fecha de finalización del parche y la compatibilidad | Fin de la disponibilidad | Imágenes compatibles |
|---|---|---|---|---|
| 2.4 (Python 3.9) | Solo CPU | 14 de julio de 2026 | 14 de enero de 2027 |
|
| 2.4 (Python 3.9) | GPU (CUDA 12.x) | 14 de julio de 2026 | 14 de enero de 2027 |
|
| 2.4 (Python 3.9) | Cloud TPU | 14 de julio de 2026 | 14 de enero de 2027 |
|
| 2.3 (Python 3.9) | Solo CPU | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 2.3 (Python 3.9) | GPU (CUDA 12.x) | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 2.3 (Python 3.9) | Cloud TPU | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 2.2 (Python 3.9) | Solo CPU | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 2.2 (Python 3.9) | GPU (CUDA 12.x) | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 2.2 (Python 3.9) | Cloud TPU | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 2.1 (Python 3.9) | Solo CPU | 01 dic 2024 | 01 dic 2025 | |
| 2.1 (Python 3.9) | GPU (CUDA 12.x) | 01 dic 2024 | 01 dic 2025 | |
| 2.1 (Python 3.9) | Cloud TPU | 01 dic 2024 | 01 dic 2025 | |
| 2.0 (Python 3.9) | Solo CPU | 27 jul 2024 | 27 jul 2025 | |
| 2.0 (Python 3.9) | GPU (CUDA 11.x) | 27 jul 2024 | 27 jul 2025 | |
| 1.13 (Python 3.8) | Solo CPU | 15 de mayo de 2024 | 15 de mayo de 2025 | |
| 1.13 (Python 3.8) | GPU (CUDA 11.x) | 15 de mayo de 2024 | 15 de mayo de 2025 | |
| 1.12 | Solo CPU | 15 de mayo de 2024 | 15 de mayo de 2025 | |
| 1.12 | GPU (CUDA 11.x) | 15 de mayo de 2024 | 15 de mayo de 2025 | |
| 1.11 | Solo CPU | 15 de mayo de 2024 | 15 de mayo de 2025 | |
| 1.11 | GPU (CUDA 11.x) | 15 de mayo de 2024 | 15 de mayo de 2025 |
scikit-learn
Imágenes de contenedor de scikit-learn disponibles (haz clic para expandir)
| Versión del marco de trabajo de AA | Aceleradores compatibles (y la versión de CUDA, si corresponde) | Fecha de finalización del parche y la compatibilidad | Fin de la disponibilidad | Imágenes compatibles |
|---|---|---|---|---|
| 1.6 (Python 3.10) | Solo CPU | 14 de octubre de 2026 | 14 de octubre de 2027 |
|
| 1.5 (Python 3.10) | Solo CPU | 14 de julio de 2026 | 14 de enero de 2027 |
|
| 1.4 (Python 3.10) | Solo CPU | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 1.3 (Python 3.10) | Solo CPU | 28 nov 2024 | 28 nov 2025 | |
| 1.2 (Python 3.10) | Solo CPU | 30 de junio de 2024 | 30 Junio de 2025 | |
| 1.0 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 0.24 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 0.23 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 0.22 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 0.20 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 |
XGBoost
Imágenes de contenedor de XGBoost disponibles (haz clic para expandir)
| Versión del marco de trabajo de AA | Aceleradores compatibles (y la versión de CUDA, si corresponde) | Fecha de finalización del parche y la compatibilidad | Fin de la disponibilidad | Imágenes compatibles |
|---|---|---|---|---|
| 2.1 (Python 3.10) | Solo CPU | 14 de julio de 2026 | 14 de enero de 2027 |
|
| 2.0 (Python 3.10) | Solo CPU | 14 de enero de 2026 | 14 de enero de 2027 |
|
| 1.7 (Python 3.10) | Solo CPU | 30 de junio de 2024 | 30 de diciembre de 2025 | |
| 1.6 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 1.5 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 1.4 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 1.3 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 1.2 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 1.1 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 0.90 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 | |
| 0.82 | Solo CPU | 15 de noviembre de 2023 | 15 de noviembre de 2024 |
Usa un contenedor compilado previamente
Puedes especificar un contenedor compilado previamente para la inferencia cuando creas un recurso TrainingPipeline personalizado que sube un Model o cuando importas artefactos de modelo como un Model.
Para usar uno de estos contenedores precompilados, debes guardar el modelo como uno o más artefactos del modelo que cumplan con los requisitos del contenedor precompilado. Para obtener más información, consulta Exporta artefactos del modelo para la inferencia.
En los siguientes notebooks, se muestra cómo usar un contenedor compilado previamente para entregar inferencias.
| ¿Qué desea hacer? | Notebook |
|---|---|
| Entrena y entrega un modelo de TensorFlow con un contenedor compilado previamente | Entrenamiento personalizado y predicción en línea |
| Entrega un modelo de PyTorch con un contenedor compilado previamente | Entrega modelos de imágenes de PyTorch con contenedores precompilados en Vertex AI |
| Entrega un modelo de dispersión estable con un contenedor compilado previamente | Implementa y aloja un modelo de dispersión estable en Vertex AI |
Notebooks
¿Qué sigue?
- Obtén información para implementar un modelo en un extremo para entregar inferencias.