Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Container predefiniti per l'inferenza e la spiegazione

Gemini Enterprise Agent Platform fornisce immagini container Docker che esegui come container predefiniti per fornire inferenze e spiegazioni da artefatti del modello addestrato. Questi container, organizzati per framework di machine learning (ML) e versione del framework, forniscono server di inferenza HTTP che puoi utilizzare per fornire inferenze con una configurazione minima. In molti casi, utilizzare un container predefinito è più semplice che creare un container personalizzato per l'inferenza.

Questo documento elenca i container predefiniti per inferenze e spiegazioni e descrive come utilizzarli con gli artefatti del modello che hai creato utilizzando la funzionalità di addestramento personalizzato di Agent Platform o con gli artefatti del modello che hai creato al di fuori di Agent Platform.

Norme e orari dell'assistenza

Gemini Enterprise Agent Platform supporta ogni versione del framework in base a una pianificazione per ridurre al minimo le vulnerabilità della sicurezza. Consulta il programma delle norme di assistenza per comprendere le implicazioni delle date di fine supporto e fine disponibilità.

Immagini container disponibili

Ciascuna delle seguenti immagini container è disponibile in diversi repository Artifact Registry, che memorizzano i dati in varie località. Puoi utilizzare uno qualsiasi degli URI per un'immagine quando esegui l'addestramento personalizzato; ognuno fornisce la stessa immagine container. Se utilizzi la console Google Cloud per creare una risorsa Model, la console Google Cloud seleziona l'URI che corrisponde meglio alla posizione in cui utilizzi Agent Platform per ridurre la latenza.

TensorFlow

Immagini container TensorFlow disponibili (fai clic per espandere)

Versione framework ML	Acceleratori supportati (e versione di CUDA, se applicabile)	Data di fine della patch e del supporto	Fine della disponibilità	Immagini supportate
2.15	Solo CPU	14 luglio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest`
2.15	GPU (CUDA 12.x)	14 luglio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest`
2.14	Solo CPU	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest`
2.14	GPU (CUDA 12.x)	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest`
2,13	Solo CPU	28 nov 2024	28 nov 2025
2,13	GPU (CUDA 12.x)	28 nov 2024	28 nov 2025
2.12	Solo CPU	30 giugno 2024	30 giugno 2025
2.12	GPU (CUDA 11.x)	30 giugno 2024	30 giugno 2025
2.11	Solo CPU	15 novembre 2023	15 nov 2024
2.11	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2.10	Solo CPU	15 novembre 2023	15 nov 2024
2.10	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2,9	Solo CPU	15 novembre 2023	15 nov 2024
2,9	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2,8	Solo CPU	15 novembre 2023	15 nov 2024
2,8	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2,7	Solo CPU	15 novembre 2023	15 nov 2024
2,7	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2,6	Solo CPU	15 novembre 2023	15 nov 2024
2,6	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2,5	Solo CPU	15 novembre 2023	15 nov 2024
2,5	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2,4	Solo CPU	15 novembre 2023	15 nov 2024
2,4	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2.3	Solo CPU	15 novembre 2023	15 nov 2024
2.3	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2.2	Solo CPU	15 novembre 2023	15 nov 2024
2.2	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2.1	Solo CPU	15 novembre 2023	15 nov 2024
2.1	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
1,15	Solo CPU	15 novembre 2023	15 nov 2024
1,15	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024

Runtime TensorFlow ottimizzato

Le seguenti immagini container utilizzano il runtime TensorFlow ottimizzato. Per maggiori informazioni, consulta Utilizzare il runtime TensorFlow ottimizzato.

Immagini container del runtime TensorFlow ottimizzato disponibili (fai clic per espandere)

Versione framework ML	Acceleratori supportati (e versione di CUDA, se applicabile)	Data di fine della patch e del supporto	Fine della disponibilità	Immagini supportate
per notte	Solo CPU	Non applicabile	Non applicabile	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest`
per notte	GPU (CUDA 12.x)	Non applicabile	Non applicabile	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest`
per notte	Cloud TPU	Non applicabile	Non applicabile	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest`
2.17	Solo CPU	11 luglio 2024	11 luglio 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest`
2.17	GPU (CUDA 12.x)	11 luglio 2024	11 luglio 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest`
2.17	Cloud TPU	11 luglio 2024	11 luglio 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest`
2.16	Solo CPU	26 aprile 2024	Apr 26, 2025
2.16	GPU (CUDA 12.x)	26 aprile 2024	Apr 26, 2025
2.16	Cloud TPU	26 aprile 2024	Apr 26, 2025
2.15	Solo CPU	15 agosto 2024	15 ago 2025
2.15	GPU (CUDA 12.x)	15 agosto 2024	15 ago 2025
2.15	Cloud TPU	15 agosto 2024	15 ago 2025
2.14	Solo CPU	15 agosto 2024	15 ago 2025
2.14	GPU (CUDA 12.x)	15 agosto 2024	15 ago 2025
2,13	Solo CPU	15 agosto 2024	15 ago 2025
2,13	GPU (CUDA 11.x)	15 agosto 2024	15 ago 2025
2.12	Solo CPU	15 maggio 2024	15 maggio 2025
2.12	GPU (CUDA 11.x)	15 maggio 2024	15 maggio 2025
2.11	Solo CPU	15 novembre 2023	15 nov 2024
2.11	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2.10	Solo CPU	15 novembre 2023	15 nov 2024
2.10	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2,9	Solo CPU	15 novembre 2023	15 nov 2024
2,9	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024
2,8	Solo CPU	15 novembre 2023	15 nov 2024
2,8	GPU (CUDA 11.x)	15 novembre 2023	15 nov 2024

PyTorch

Immagini container PyTorch disponibili (fai clic per espandere)

Versione framework ML	Acceleratori supportati (e versione di CUDA, se applicabile)	Data di fine della patch e del supporto	Fine della disponibilità	Immagini supportate
2.4 (Python 3.9)	Solo CPU	14 luglio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest`
2.4 (Python 3.9)	GPU (CUDA 12.x)	14 luglio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest`
2.4 (Python 3.9)	Cloud TPU	14 luglio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest`
2.3 (Python 3.9)	Solo CPU	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest`
2.3 (Python 3.9)	GPU (CUDA 12.x)	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest`
2.3 (Python 3.9)	Cloud TPU	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest`
2.2 (Python 3.9)	Solo CPU	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest`
2.2 (Python 3.9)	GPU (CUDA 12.x)	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest`
2.2 (Python 3.9)	Cloud TPU	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest`
2.1 (Python 3.9)	Solo CPU	1° dic 2024	1° dicembre 2025
2.1 (Python 3.9)	GPU (CUDA 12.x)	1° dic 2024	1° dicembre 2025
2.1 (Python 3.9)	Cloud TPU	1° dic 2024	1° dicembre 2025
2.0 (Python 3.9)	Solo CPU	27 luglio 2024	27 luglio 2025
2.0 (Python 3.9)	GPU (CUDA 11.x)	27 luglio 2024	27 luglio 2025
1.13 (Python 3.8)	Solo CPU	15 maggio 2024	15 maggio 2025
1.13 (Python 3.8)	GPU (CUDA 11.x)	15 maggio 2024	15 maggio 2025
1,12	Solo CPU	15 maggio 2024	15 maggio 2025
1,12	GPU (CUDA 11.x)	15 maggio 2024	15 maggio 2025
1,11	Solo CPU	15 maggio 2024	15 maggio 2025
1,11	GPU (CUDA 11.x)	15 maggio 2024	15 maggio 2025

scikit-learn

Immagini container scikit-learn disponibili (fai clic per espandere)

Versione framework ML	Acceleratori supportati (e versione di CUDA, se applicabile)	Data di fine della patch e del supporto	Fine della disponibilità	Immagini supportate
1.6 (Python 3.10)	Solo CPU	14 ottobre 2026	14 ottobre 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest`
1.5 (Python 3.10)	Solo CPU	14 luglio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest`
1.4 (Python 3.10)	Solo CPU	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest`
1.3 (Python 3.10)	Solo CPU	28 nov 2024	28 nov 2025
1.2 (Python 3.10)	Solo CPU	30 giugno 2024	30 giugno 2025
1.0	Solo CPU	15 novembre 2023	15 nov 2024
0,24	Solo CPU	15 novembre 2023	15 nov 2024
0,23	Solo CPU	15 novembre 2023	15 nov 2024
0,22	Solo CPU	15 novembre 2023	15 nov 2024
0,20	Solo CPU	15 novembre 2023	15 nov 2024

XGBoost

Immagini container XGBoost disponibili (fai clic per espandere)

Versione framework ML	Acceleratori supportati (e versione di CUDA, se applicabile)	Data di fine della patch e del supporto	Fine della disponibilità	Immagini supportate
2.1 (Python 3.10)	Solo CPU	14 luglio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest` `europe-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest` `asia-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest`
2.0 (Python 3.10)	Solo CPU	14 gennaio 2026	14 gennaio 2027	`us-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest` `europe-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest` `asia-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest`
1.7 (Python 3.10)	Solo CPU	30 giugno 2024	30 dicembre 2025
1.6	Solo CPU	15 novembre 2023	15 nov 2024
1,5	Solo CPU	15 novembre 2023	15 nov 2024
1.4	Solo CPU	15 novembre 2023	15 nov 2024
1.3	Solo CPU	15 novembre 2023	15 nov 2024
1.2	Solo CPU	15 novembre 2023	15 nov 2024
1.1	Solo CPU	15 novembre 2023	15 nov 2024
0,90	Solo CPU	15 novembre 2023	15 nov 2024
0,82	Solo CPU	15 novembre 2023	15 nov 2024

Utilizzare un container predefinito

Puoi specificare un container predefinito per l'inferenza quando crei una risorsa TrainingPipeline personalizzata che carica un Model o quando importi gli artefatti del modello come Model.

Per utilizzare uno di questi contenitori predefiniti, devi salvare il modello come uno o più artefatti del modello conformi ai requisiti del contenitore predefinito. Per saperne di più, consulta Esportare gli artefatti del modello per l'inferenza.

I seguenti blocchi note mostrano come utilizzare un container precompilato per pubblicare inferenze.

Che cosa vuoi fare?	Notebook
Addestra ed eroga un modello TensorFlow utilizzando un container predefinito	Addestramento personalizzato e inferenza online
Erogare un modello PyTorch utilizzando un container predefinito	Erogazione di modelli di immagini PyTorch con container predefiniti su Agent Platform
Erogare un modello di diffusione Stable Diffusion utilizzando un container predefinito	Esegui il deployment e ospita un modello di diffusione stabile su Agent Platform

Notebook

Passaggi successivi

Scopri come eseguire il deployment di un modello in un endpoint per fornire inferenze.