A Vertex AI oferece imagens de contêiner do Docker executadas como contêineres pré-criados para disponibilizar inferências e explicações com artefatos de modelo treinados. Esses contêineres, que são organizados por framework de machine learning (ML) e versão do framework, fornecem servidores de inferência HTTP que podem ser usados para exibir inferências com uma configuração mínima. Em muitos casos, usar um contêiner pré-criado é mais simples do que criar o próprio contêiner personalizado para inferência.
Neste documento, listamos os contêineres pré-criados para inferências e explicações e descrevemos como usá-los com artefatos de modelo criados usando a funcionalidade de treinamento personalizada da Vertex AI ou artefatos de modelo que você criou fora da Vertex AI.
Política e cronograma de suporte
A Vertex AI é compatível com cada versão de framework com base em uma programação para minimizar as vulnerabilidades de segurança. Consulte o cronograma da política de suporte para entender as implicações das datas de término do suporte e fim da disponibilidade.
Imagens de contêiner disponíveis
Cada uma das imagens de contêiner a seguir está disponível em vários
repositórios do Artifact Registry, que armazenam dados em
vários locais. É possível usar qualquer um dos
URIs de uma imagem ao realizar o treinamento personalizado. cada um deles fornece a mesma
imagem de contêiner. Se você usar o console Google Cloud para criar um recurso
Model,
o console Google Cloud seleciona o URI que melhor corresponde ao local em que
você está usando a Vertex AI para reduzir
a latência.
TensorFlow
Imagens de contêiner do TensorFlow disponíveis (clique para expandir)
| Versão do framework de MLs | Aceleradores compatíveis (e a versão CUDA, se aplicável) | Fim do patch e da data de suporte | Fim da disponibilidade | Imagens compatíveis |
|---|---|---|---|---|
| 2.15 | Somente CPU | 14 de julho de 2026 | 14 de janeiro de 2027 |
|
| 2.15 | GPU (CUDA 12.x) | 14 de julho de 2026 | 14 de janeiro de 2027 |
|
| 2.14 | Somente CPU | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 2.14 | GPU (CUDA 12.x) | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 2,13 | Somente CPU | 28 de novembro de 2024 | 28 de novembro de 2025 | |
| 2,13 | GPU (CUDA 12.x) | 28 de novembro de 2024 | 28 de novembro de 2025 | |
| 2,12 | Somente CPU | 30 de junho de 2024 | 30 de junho de 2025 | |
| 2,12 | GPU (CUDA 11.x) | 30 de junho de 2024 | 30 de junho de 2025 | |
| 2.11 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.10 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.9 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.9 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.8 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.8 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.7 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.7 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2,6 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2,6 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.5 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.5 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2,4 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2,4 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.3 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.3 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.2 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.2 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.1 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.1 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 1.15 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 1.15 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 |
Ambiente de execução otimizado do TensorFlow
As imagens de contêiner a seguir usam o ambiente de execução otimizado do TensorFlow. Para mais informações, consulte Usar o ambiente de execução otimizado do TensorFlow.
Imagens de contêiner do ambiente de execução otimizado do TensorFlow disponíveis (clique para abrir)
| Versão do framework de MLs | Aceleradores compatíveis (e a versão CUDA, se aplicável) | Fim do patch e da data de suporte | Fim da disponibilidade | Imagens compatíveis |
|---|---|---|---|---|
| noturno | Somente CPU | Não aplicável | Não aplicável |
|
| noturno | GPU (CUDA 12.x) | Não aplicável | Não aplicável |
|
| noturno | Cloud TPU | Não aplicável | Não relevante |
|
| 2,17 | Somente CPU | 11 de julho de 2024 | 11 de julho de 2025 |
|
| 2,17 | GPU (CUDA 12.x) | 11 de julho de 2024 | 11 de julho de 2025 |
|
| 2,17 | Cloud TPU | 11 de julho de 2024 | 11 de julho de 2025 |
|
| 2,16 | Somente CPU | 26 de abril de 2024 | 26 de abril de 2025 | |
| 2,16 | GPU (CUDA 12.x) | 26 de abril de 2024 | 26 de abril de 2025 | |
| 2,16 | Cloud TPU | 26 de abril de 2024 | 26 de abril de 2025 | |
| 2.15 | Somente CPU | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.15 | GPU (CUDA 12.x) | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.15 | Cloud TPU | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.14 | Somente CPU | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2.14 | GPU (CUDA 12.x) | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2,13 | Somente CPU | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2,13 | GPU (CUDA 11.x) | 15 de agosto de 2024 | 15 de agosto de 2025 | |
| 2,12 | Somente CPU | 15 de maio de 2024 | 15 de maio de 2025 | |
| 2,12 | GPU (CUDA 11.x) | 15 de maio de 2024 | 15 de maio de 2025 | |
| 2.11 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.11 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.10 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.10 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.9 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.9 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.8 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 2.8 | GPU (CUDA 11.x) | 15 de novembro de 2023 | 15 de novembro de 2024 |
PyTorch
Imagens de contêiner do PyTorch disponíveis (clique para expandir)
| Versão do framework de MLs | Aceleradores compatíveis (e a versão CUDA, se aplicável) | Fim do patch e da data de suporte | Fim da disponibilidade | Imagens compatíveis |
|---|---|---|---|---|
| 2.4 (Python 3.9) | Somente CPU | 14 de julho de 2026 | 14 de janeiro de 2027 |
|
| 2.4 (Python 3.9) | GPU (CUDA 12.x) | 14 de julho de 2026 | 14 de janeiro de 2027 |
|
| 2.4 (Python 3.9) | Cloud TPU | 14 de julho de 2026 | 14 de janeiro de 2027 |
|
| 2.3 (Python 3.9) | Somente CPU | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 2.3 (Python 3.9) | GPU (CUDA 12.x) | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 2.3 (Python 3.9) | Cloud TPU | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 2.2 (Python 3.9) | Somente CPU | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 2.2 (Python 3.9) | GPU (CUDA 12.x) | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 2.2 (Python 3.9) | Cloud TPU | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 2.1 (Python 3.9) | Somente CPU | 1º de dezembro de 2024 | 1º de dezembro de 2025 | |
| 2.1 (Python 3.9) | GPU (CUDA 12.x) | 1º de dezembro de 2024 | 1º de dezembro de 2025 | |
| 2.1 (Python 3.9) | Cloud TPU | 1º de dezembro de 2024 | 1º de dezembro de 2025 | |
| 2.0 (Python 3.9) | Somente CPU | 27 de julho de 2024 | 27 de julho de 2025 | |
| 2.0 (Python 3.9) | GPU (CUDA 11.x) | 27 de julho de 2024 | 27 de julho de 2025 | |
| 1.13 (Python 3.8) | Somente CPU | 15 de maio de 2024 | 15 de maio de 2025 | |
| 1.13 (Python 3.8) | GPU (CUDA 11.x) | 15 de maio de 2024 | 15 de maio de 2025 | |
| 1.12 | Somente CPU | 15 de maio de 2024 | 15 de maio de 2025 | |
| 1.12 | GPU (CUDA 11.x) | 15 de maio de 2024 | 15 de maio de 2025 | |
| 1.11 | Somente CPU | 15 de maio de 2024 | 15 de maio de 2025 | |
| 1.11 | GPU (CUDA 11.x) | 15 de maio de 2024 | 15 de maio de 2025 |
scikit-learn
Imagens de contêiner do scikit-learn disponíveis (clique para abrir)
| Versão do framework de MLs | Aceleradores compatíveis (e a versão CUDA, se aplicável) | Fim do patch e da data de suporte | Fim da disponibilidade | Imagens compatíveis |
|---|---|---|---|---|
| 1.6 (Python 3.10) | Somente CPU | 14 de outubro de 2026 | 14 de outubro de 2027 |
|
| 1.5 (Python 3.10) | Somente CPU | 14 de julho de 2026 | 14 de janeiro de 2027 |
|
| 1.4 (Python 3.10) | Somente CPU | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 1.3 (Python 3.10) | Somente CPU | 28 de novembro de 2024 | 28 de novembro de 2025 | |
| 1.2 (Python 3.10) | Somente CPU | 30 de junho de 2024 | 30 de junho de 2025 | |
| 1,0 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 0,24 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 0.23 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 0,22 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 0,20 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 |
XGBoost
Imagens de contêiner XGBoost disponíveis (clique para abrir)
| Versão do framework de MLs | Aceleradores compatíveis (e a versão CUDA, se aplicável) | Fim do patch e da data de suporte | Fim da disponibilidade | Imagens compatíveis |
|---|---|---|---|---|
| 2.1 (Python 3.10) | Somente CPU | 14 de julho de 2026 | 14 de janeiro de 2027 |
|
| 2.0 (Python 3.10) | Somente CPU | 14 de janeiro de 2026 | 14 de janeiro de 2027 |
|
| 1.7 (Python 3.10) | Somente CPU | 30 de junho de 2024 | 30 de dezembro de 2025 | |
| 1.6 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 1.5 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 1.4 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 1.3 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 1.2 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 1.1 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 0,90 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 | |
| 0,82 | Somente CPU | 15 de novembro de 2023 | 15 de novembro de 2024 |
Usar um contêiner predefinido
É possível especificar um contêiner predefinido para inferência quando
você criar um recurso TrainingPipeline personalizado que faça upload de um Model ou quando
importar artefatos de modelo como um Model.
Para usar um desses contêineres predefinidos, salve seu modelo como um ou mais artefatos de modelo que atendam aos requisitos do contêiner pré-criado. Para mais informações, consulte Exportar artefatos de modelo para inferência.
Os notebooks a seguir demonstram como usar um contêiner pré-criado para veicular inferências.
| O que você quer fazer? | Notebook |
|---|---|
| Treinar e exibir um modelo do TensorFlow usando um contêiner pré-criado | Treinamento personalizado e inferência on-line |
| Exibir um modelo do PyTorch usando um contêiner pré-criado | Como disponibilizar modelos de imagem do PyTorch com contêineres predefinidos na Vertex AI |
| Exibir um modelo de difusão estável usando um contêiner pré-criado | Implantar e hospedar um modelo de difusão estável na Vertex AI |