Vertex AI fornisce immagini container Docker che esegui come container predefiniti per fornire inferenze e spiegazioni da artefatti del modello addestrato. Questi container, organizzati per framework di machine learning (ML) e versione del framework, forniscono server di inferenza HTTP che puoi utilizzare per fornire inferenze con una configurazione minima. In molti casi, utilizzare un container predefinito è più semplice che creare un container personalizzato per l'inferenza.
Questo documento elenca i container predefiniti per inferenze e spiegazioni e descrive come utilizzarli con gli artefatti del modello che hai creato utilizzando la funzionalità di addestramento personalizzato di Vertex AI o con gli artefatti del modello che hai creato al di fuori di Vertex AI.
Criteri e pianificazione dell'assistenza
Vertex AI supporta ogni versione del framework in base a una pianificazione per ridurre al minimo le vulnerabilità della sicurezza. Consulta il programma delle norme di assistenza per comprendere le implicazioni delle date di fine supporto e fine disponibilità.
Immagini container disponibili
Ciascuna delle seguenti immagini container è disponibile in diversi repository Artifact Registry, che archiviano i dati in varie località. Puoi utilizzare uno qualsiasi degli URI per un'immagine quando esegui l'addestramento personalizzato. Ogni URI fornisce la stessa immagine container. Se utilizzi la console Google Cloud per creare una risorsa
Model, la console Google Cloud seleziona l'URI che corrisponde meglio alla posizione in cui utilizzi Vertex AI per ridurre la latenza.
TensorFlow
Immagini container TensorFlow disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| 2.15 | Solo CPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.15 | GPU (CUDA 12.x) | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.14 | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.14 | GPU (CUDA 12.x) | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2,13 | Solo CPU | 28 nov 2024 | 28 nov 2025 | |
| 2,13 | GPU (CUDA 12.x) | 28 nov 2024 | 28 nov 2025 | |
| 2.12 | Solo CPU | 30 giugno 2024 | 30 giugno 2025 | |
| 2.12 | GPU (CUDA 11.x) | 30 giugno 2024 | 30 giugno 2025 | |
| 2.11 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.10 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,9 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,9 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,8 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,8 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,7 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,7 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,6 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,6 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,5 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,5 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,4 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,4 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.3 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.3 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.2 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.2 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.1 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.1 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 1,15 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1,15 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 |
Runtime TensorFlow ottimizzato
Le seguenti immagini container utilizzano il runtime TensorFlow ottimizzato. Per maggiori informazioni, consulta Utilizzare il runtime TensorFlow ottimizzato.
Immagini container del runtime TensorFlow ottimizzato disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| a notte | Solo CPU | Non applicabile | Non applicabile |
|
| a notte | GPU (CUDA 12.x) | Non applicabile | Non applicabile |
|
| a notte | Cloud TPU | Non applicabile | Non applicabile |
|
| 2.17 | Solo CPU | 11 luglio 2024 | 11 luglio 2025 |
|
| 2.17 | GPU (CUDA 12.x) | 11 luglio 2024 | 11 luglio 2025 |
|
| 2.17 | Cloud TPU | 11 luglio 2024 | 11 luglio 2025 |
|
| 2.16 | Solo CPU | 26 aprile 2024 | Apr 26, 2025 | |
| 2.16 | GPU (CUDA 12.x) | 26 aprile 2024 | Apr 26, 2025 | |
| 2.16 | Cloud TPU | 26 aprile 2024 | Apr 26, 2025 | |
| 2.15 | Solo CPU | 15 agosto 2024 | 15 ago 2025 | |
| 2.15 | GPU (CUDA 12.x) | 15 agosto 2024 | 15 ago 2025 | |
| 2.15 | Cloud TPU | 15 agosto 2024 | 15 ago 2025 | |
| 2.14 | Solo CPU | 15 agosto 2024 | 15 ago 2025 | |
| 2.14 | GPU (CUDA 12.x) | 15 agosto 2024 | 15 ago 2025 | |
| 2,13 | Solo CPU | 15 agosto 2024 | 15 ago 2025 | |
| 2,13 | GPU (CUDA 11.x) | 15 agosto 2024 | 15 ago 2025 | |
| 2.12 | Solo CPU | 15 maggio 2024 | 15 maggio 2025 | |
| 2.12 | GPU (CUDA 11.x) | 15 maggio 2024 | 15 maggio 2025 | |
| 2.11 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.10 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,9 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,9 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,8 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,8 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 |
PyTorch
Immagini container PyTorch disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| 2.4 (Python 3.9) | Solo CPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.4 (Python 3.9) | GPU (CUDA 12.x) | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.4 (Python 3.9) | Cloud TPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.3 (Python 3.9) | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.3 (Python 3.9) | GPU (CUDA 12.x) | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.3 (Python 3.9) | Cloud TPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.2 (Python 3.9) | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.2 (Python 3.9) | GPU (CUDA 12.x) | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.2 (Python 3.9) | Cloud TPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.1 (Python 3.9) | Solo CPU | 1° dic 2024 | 1° dicembre 2025 | |
| 2.1 (Python 3.9) | GPU (CUDA 12.x) | 1° dic 2024 | 1° dicembre 2025 | |
| 2.1 (Python 3.9) | Cloud TPU | 1° dic 2024 | 1° dicembre 2025 | |
| 2.0 (Python 3.9) | Solo CPU | 27 luglio 2024 | 27 luglio 2025 | |
| 2.0 (Python 3.9) | GPU (CUDA 11.x) | 27 luglio 2024 | 27 luglio 2025 | |
| 1.13 (Python 3.8) | Solo CPU | 15 maggio 2024 | 15 maggio 2025 | |
| 1.13 (Python 3.8) | GPU (CUDA 11.x) | 15 maggio 2024 | 15 maggio 2025 | |
| 1,12 | Solo CPU | 15 maggio 2024 | 15 maggio 2025 | |
| 1,12 | GPU (CUDA 11.x) | 15 maggio 2024 | 15 maggio 2025 | |
| 1,11 | Solo CPU | 15 maggio 2024 | 15 maggio 2025 | |
| 1,11 | GPU (CUDA 11.x) | 15 maggio 2024 | 15 maggio 2025 |
scikit-learn
Immagini container scikit-learn disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| 1.6 (Python 3.10) | Solo CPU | 14 ottobre 2026 | 14 ottobre 2027 |
|
| 1.5 (Python 3.10) | Solo CPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 1.4 (Python 3.10) | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 1.3 (Python 3.10) | Solo CPU | 28 nov 2024 | 28 nov 2025 | |
| 1.2 (Python 3.10) | Solo CPU | 30 giugno 2024 | 30 giugno 2025 | |
| 1.0 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,24 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,23 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,22 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,20 | Solo CPU | 15 novembre 2023 | 15 nov 2024 |
XGBoost
Immagini container XGBoost disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| 2.1 (Python 3.10) | Solo CPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.0 (Python 3.10) | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 1.7 (Python 3.10) | Solo CPU | 30 giugno 2024 | 30 dicembre 2025 | |
| 1.6 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1,5 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1.4 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1.3 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1.2 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1.1 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,90 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,82 | Solo CPU | 15 novembre 2023 | 15 nov 2024 |
Utilizzare un container predefinito
Puoi specificare un container predefinito per l'inferenza quando
crei una risorsa TrainingPipeline personalizzata che carica un Model o quando
importi gli artefatti del modello come Model.
Per utilizzare uno di questi contenitori predefiniti, devi salvare il modello come uno o più artefatti del modello che rispettino i requisiti del contenitore predefinito. Per saperne di più, consulta Esportare gli artefatti del modello per l'inferenza.
I seguenti blocchi note mostrano come utilizzare un container predefinito per pubblicare inferenze.
| Che cosa vuoi fare? | Notebook |
|---|---|
| Addestra e gestisci un modello TensorFlow utilizzando un container predefinito | Addestramento personalizzato e inferenza online |
| Pubblica un modello PyTorch utilizzando un container predefinito | Serving di modelli di immagini PyTorch con container predefiniti su Vertex AI |
| Pubblica un modello Stable Diffusion utilizzando un container predefinito | Esegui il deployment e ospita un modello Stable Diffusion su Vertex AI |