Gemini Enterprise Agent Platform fornisce immagini container Docker che esegui come container predefiniti per fornire inferenze e spiegazioni da artefatti del modello addestrato. Questi container, organizzati per framework di machine learning (ML) e versione del framework, forniscono server di inferenza HTTP che puoi utilizzare per fornire inferenze con una configurazione minima. In molti casi, utilizzare un container predefinito è più semplice che creare un container personalizzato per l'inferenza.
Questo documento elenca i container predefiniti per inferenze e spiegazioni e descrive come utilizzarli con gli artefatti del modello che hai creato utilizzando la funzionalità di addestramento personalizzato di Agent Platform o con gli artefatti del modello che hai creato al di fuori di Agent Platform.
Norme e orari dell'assistenza
Gemini Enterprise Agent Platform supporta ogni versione del framework in base a una pianificazione per ridurre al minimo le vulnerabilità di sicurezza. Consulta la pianificazione delle norme di assistenza per comprendere le implicazioni delle date di fine assistenza e fine disponibilità.
Immagini container disponibili
Ciascuna delle seguenti immagini container è disponibile in diversi repository Artifact Registry, che memorizzano i dati in varie località. Puoi utilizzare uno qualsiasi degli URI per un'immagine quando esegui l'addestramento personalizzato; ognuno fornisce la stessa immagine container. Se utilizzi la console Google Cloud per creare una risorsa Model, la console Google Cloud seleziona l'URI che corrisponde meglio alla posizione in cui utilizzi Agent Platform per ridurre la latenza.
TensorFlow
Immagini container TensorFlow disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| 2.15 | Solo CPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.15 | GPU (CUDA 12.x) | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.14 | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.14 | GPU (CUDA 12.x) | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2,13 | Solo CPU | 28 nov 2024 | 28 nov 2025 | |
| 2,13 | GPU (CUDA 12.x) | 28 nov 2024 | 28 nov 2025 | |
| 2.12 | Solo CPU | 30 giugno 2024 | 30 giugno 2025 | |
| 2.12 | GPU (CUDA 11.x) | 30 giugno 2024 | 30 giugno 2025 | |
| 2.11 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.10 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,9 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,9 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,8 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,8 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,7 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,7 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,6 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,6 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,5 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,5 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,4 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,4 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.3 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.3 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.2 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.2 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.1 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.1 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 1,15 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1,15 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 |
Runtime TensorFlow ottimizzato
Le seguenti immagini container utilizzano il runtime TensorFlow ottimizzato. Per maggiori informazioni, consulta Utilizzare il runtime TensorFlow ottimizzato.
Immagini container del runtime TensorFlow ottimizzato disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| per notte | Solo CPU | Non applicabile | Non applicabile |
|
| per notte | GPU (CUDA 12.x) | Non applicabile | Non applicabile |
|
| per notte | Cloud TPU | Non applicabile | Non applicabile |
|
| 2.17 | Solo CPU | 11 luglio 2024 | 11 luglio 2025 |
|
| 2.17 | GPU (CUDA 12.x) | 11 luglio 2024 | 11 luglio 2025 |
|
| 2.17 | Cloud TPU | 11 luglio 2024 | 11 luglio 2025 |
|
| 2.16 | Solo CPU | 26 aprile 2024 | Apr 26, 2025 | |
| 2.16 | GPU (CUDA 12.x) | 26 aprile 2024 | Apr 26, 2025 | |
| 2.16 | Cloud TPU | 26 aprile 2024 | Apr 26, 2025 | |
| 2.15 | Solo CPU | 15 agosto 2024 | 15 ago 2025 | |
| 2.15 | GPU (CUDA 12.x) | 15 agosto 2024 | 15 ago 2025 | |
| 2.15 | Cloud TPU | 15 agosto 2024 | 15 ago 2025 | |
| 2.14 | Solo CPU | 15 agosto 2024 | 15 ago 2025 | |
| 2.14 | GPU (CUDA 12.x) | 15 agosto 2024 | 15 ago 2025 | |
| 2,13 | Solo CPU | 15 agosto 2024 | 15 ago 2025 | |
| 2,13 | GPU (CUDA 11.x) | 15 agosto 2024 | 15 ago 2025 | |
| 2.12 | Solo CPU | 15 maggio 2024 | 15 maggio 2025 | |
| 2.12 | GPU (CUDA 11.x) | 15 maggio 2024 | 15 maggio 2025 | |
| 2.11 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2.10 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,9 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,9 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 | |
| 2,8 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 2,8 | GPU (CUDA 11.x) | 15 novembre 2023 | 15 nov 2024 |
PyTorch
Immagini container PyTorch disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| 2.4 (Python 3.9) | Solo CPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.4 (Python 3.9) | GPU (CUDA 12.x) | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.4 (Python 3.9) | Cloud TPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.3 (Python 3.9) | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.3 (Python 3.9) | GPU (CUDA 12.x) | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.3 (Python 3.9) | Cloud TPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.2 (Python 3.9) | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.2 (Python 3.9) | GPU (CUDA 12.x) | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.2 (Python 3.9) | Cloud TPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 2.1 (Python 3.9) | Solo CPU | 1° dic 2024 | 1° dicembre 2025 | |
| 2.1 (Python 3.9) | GPU (CUDA 12.x) | 1° dic 2024 | 1° dicembre 2025 | |
| 2.1 (Python 3.9) | Cloud TPU | 1° dic 2024 | 1° dicembre 2025 | |
| 2.0 (Python 3.9) | Solo CPU | 27 luglio 2024 | 27 luglio 2025 | |
| 2.0 (Python 3.9) | GPU (CUDA 11.x) | 27 luglio 2024 | 27 luglio 2025 | |
| 1.13 (Python 3.8) | Solo CPU | 15 maggio 2024 | 15 maggio 2025 | |
| 1.13 (Python 3.8) | GPU (CUDA 11.x) | 15 maggio 2024 | 15 maggio 2025 | |
| 1,12 | Solo CPU | 15 maggio 2024 | 15 maggio 2025 | |
| 1,12 | GPU (CUDA 11.x) | 15 maggio 2024 | 15 maggio 2025 | |
| 1,11 | Solo CPU | 15 maggio 2024 | 15 maggio 2025 | |
| 1,11 | GPU (CUDA 11.x) | 15 maggio 2024 | 15 maggio 2025 |
scikit-learn
Immagini container scikit-learn disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| 1.6 (Python 3.10) | Solo CPU | 14 ottobre 2026 | 14 ottobre 2027 |
|
| 1.5 (Python 3.10) | Solo CPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 1.4 (Python 3.10) | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 1.3 (Python 3.10) | Solo CPU | 28 nov 2024 | 28 nov 2025 | |
| 1.2 (Python 3.10) | Solo CPU | 30 giugno 2024 | 30 giugno 2025 | |
| 1.0 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,24 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,23 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,22 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,20 | Solo CPU | 15 novembre 2023 | 15 nov 2024 |
XGBoost
Immagini container XGBoost disponibili (fai clic per espandere)
| Versione framework ML | Acceleratori supportati (e versione di CUDA, se applicabile) | Data di fine della patch e del supporto | Fine della disponibilità | Immagini supportate |
|---|---|---|---|---|
| 2.1 (Python 3.10) | Solo CPU | 14 luglio 2026 | 14 gennaio 2027 |
|
| 2.0 (Python 3.10) | Solo CPU | 14 gennaio 2026 | 14 gennaio 2027 |
|
| 1.7 (Python 3.10) | Solo CPU | 30 giugno 2024 | 30 dicembre 2025 | |
| 1.6 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1,5 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1.4 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1.3 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1.2 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 1.1 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,90 | Solo CPU | 15 novembre 2023 | 15 nov 2024 | |
| 0,82 | Solo CPU | 15 novembre 2023 | 15 nov 2024 |
Utilizzare un container predefinito
Puoi specificare un container predefinito per l'inferenza quando
crei una risorsa TrainingPipeline personalizzata che carica un Model o quando
importi gli artefatti del modello come Model.
Per utilizzare uno di questi contenitori predefiniti, devi salvare il modello come uno o più artefatti del modello conformi ai requisiti del contenitore predefinito. Per saperne di più, consulta Esportare gli artefatti del modello per l'inferenza.
I seguenti blocchi note mostrano come utilizzare un container precompilato per pubblicare inferenze.
| Che cosa vuoi fare? | Notebook |
|---|---|
| Addestra ed eroga un modello TensorFlow utilizzando un container predefinito | Addestramento personalizzato e inferenza online |
| Erogare un modello PyTorch utilizzando un container predefinito | Erogazione di modelli di immagini PyTorch con container predefiniti su Agent Platform |
| Erogare un modello di diffusione Stable Diffusion utilizzando un container predefinito | Esegui il deployment e ospita un modello di diffusione stabile su Agent Platform |