Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Contêineres pré-criados para inferência e explicação

A plataforma de agentes do Gemini Enterprise oferece imagens de contêiner do Docker executadas como contêineres pré-criados para disponibilizar inferências e explicações com artefatos de modelo treinados. Esses contêineres, que são organizados por framework de machine learning (ML) e versão do framework, fornecem servidores de inferência HTTP que podem ser usados para disponibilizar inferências com uma configuração mínima. Em muitos casos, usar um contêiner pré-criado é mais simples do que criar o próprio contêiner personalizado para inferência.

Neste documento, listamos os contêineres pré-criados para inferências e explicações e descrevemos como usá-los com artefatos de modelo criados usando a funcionalidade de treinamento personalizada da Agent Platform ou artefatos de modelo que você criou fora da Agent Platform.

Política e cronograma de suporte

A plataforma de agentes do Gemini Enterprise é compatível com cada versão de framework com base em uma programação para minimizar as vulnerabilidades de segurança. Consulte a programação da política de suporte para entender as implicações das datas de término e de fim da disponibilidade do suporte.

Imagens de contêiner disponíveis

Cada uma das imagens de contêiner a seguir está disponível em vários repositórios do Artifact Registry, que armazenam dados em vários locais. É possível usar qualquer um dos URIs de uma imagem ao realizar o treinamento personalizado. cada um deles fornece a mesma imagem de contêiner. Se você usar o console do Google Cloud para criar um recurso Model, o console do Google Cloud selecionará o URI que melhor corresponde ao local em que você está usando a Agent Platform para reduzir a latência.

TensorFlow

Imagens de contêiner do TensorFlow disponíveis (clique para expandir)

Versão do framework de MLs	Aceleradores compatíveis (e a versão CUDA, se aplicável)	Fim do patch e da data de suporte	Fim da disponibilidade	Imagens compatíveis
2.15	Somente CPU	14 de julho de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-15:latest`
2.15	GPU (CUDA 12.x)	14 de julho de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-15:latest`
2.14	Somente CPU	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-cpu.2-14:latest`
2.14	GPU (CUDA 12.x)	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest` `europe-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest` `asia-docker.pkg.dev/vertex-ai/prediction/tf2-gpu.2-14:latest`
2,13	Somente CPU	28 de novembro de 2024	28 de novembro de 2025
2,13	GPU (CUDA 12.x)	28 de novembro de 2024	28 de novembro de 2025
2,12	Somente CPU	30 de junho de 2024	30 de junho de 2025
2,12	GPU (CUDA 11.x)	30 de junho de 2024	30 de junho de 2025
2.11	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.11	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.10	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.10	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.9	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.9	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.8	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.8	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.7	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.7	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2,6	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2,6	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.5	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.5	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2,4	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2,4	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.3	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.3	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.2	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.2	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.1	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.1	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
1.15	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
1.15	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024

Ambiente de execução otimizado do TensorFlow

As imagens de contêiner a seguir usam o ambiente de execução otimizado do TensorFlow. Para mais informações, consulte Usar o ambiente de execução otimizado do TensorFlow.

Imagens de contêiner do ambiente de execução otimizado do TensorFlow disponíveis (clique para abrir)

Versão do framework de MLs	Aceleradores compatíveis (e a versão CUDA, se aplicável)	Fim do patch e da data de suporte	Fim da disponibilidade	Imagens compatíveis
noturno	Somente CPU	Não aplicável	Não aplicável	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.nightly:latest`
noturno	GPU (CUDA 12.x)	Não aplicável	Não aplicável	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.nightly:latest`
noturno	Cloud TPU	Não aplicável	Não relevante	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.nightly:latest`
2,17	Somente CPU	11 de julho de 2024	11 de julho de 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-cpu.2-17:latest`
2,17	GPU (CUDA 12.x)	11 de julho de 2024	11 de julho de 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-gpu.2-17:latest`
2,17	Cloud TPU	11 de julho de 2024	11 de julho de 2025	`us-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest` `europe-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest` `asia-docker.pkg.dev/vertex-ai-restricted/prediction/tf_opt-tpu.2-17:latest`
2,16	Somente CPU	26 de abril de 2024	26 de abril de 2025
2,16	GPU (CUDA 12.x)	26 de abril de 2024	26 de abril de 2025
2,16	Cloud TPU	26 de abril de 2024	26 de abril de 2025
2.15	Somente CPU	15 de agosto de 2024	15 de agosto de 2025
2.15	GPU (CUDA 12.x)	15 de agosto de 2024	15 de agosto de 2025
2.15	Cloud TPU	15 de agosto de 2024	15 de agosto de 2025
2.14	Somente CPU	15 de agosto de 2024	15 de agosto de 2025
2.14	GPU (CUDA 12.x)	15 de agosto de 2024	15 de agosto de 2025
2,13	Somente CPU	15 de agosto de 2024	15 de agosto de 2025
2,13	GPU (CUDA 11.x)	15 de agosto de 2024	15 de agosto de 2025
2,12	Somente CPU	15 de maio de 2024	15 de maio de 2025
2,12	GPU (CUDA 11.x)	15 de maio de 2024	15 de maio de 2025
2.11	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.11	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.10	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.10	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.9	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.9	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024
2.8	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
2.8	GPU (CUDA 11.x)	15 de novembro de 2023	15 de novembro de 2024

PyTorch

Imagens de contêiner do PyTorch disponíveis (clique para expandir)

Versão do framework de MLs	Aceleradores compatíveis (e a versão CUDA, se aplicável)	Fim do patch e da data de suporte	Fim da disponibilidade	Imagens compatíveis
2.4 (Python 3.9)	Somente CPU	14 de julho de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-4:latest`
2.4 (Python 3.9)	GPU (CUDA 12.x)	14 de julho de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-4:latest`
2.4 (Python 3.9)	Cloud TPU	14 de julho de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-4:latest`
2.3 (Python 3.9)	Somente CPU	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-3:latest`
2.3 (Python 3.9)	GPU (CUDA 12.x)	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-3:latest`
2.3 (Python 3.9)	Cloud TPU	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-3:latest`
2.2 (Python 3.9)	Somente CPU	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-cpu.2-2:latest`
2.2 (Python 3.9)	GPU (CUDA 12.x)	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-gpu.2-2:latest`
2.2 (Python 3.9)	Cloud TPU	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest` `europe-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest` `asia-docker.pkg.dev/vertex-ai/prediction/pytorch-tpu.2-2:latest`
2.1 (Python 3.9)	Somente CPU	1º de dezembro de 2024	1º de dezembro de 2025
2.1 (Python 3.9)	GPU (CUDA 12.x)	1º de dezembro de 2024	1º de dezembro de 2025
2.1 (Python 3.9)	Cloud TPU	1º de dezembro de 2024	1º de dezembro de 2025
2.0 (Python 3.9)	Somente CPU	27 de julho de 2024	27 de julho de 2025
2.0 (Python 3.9)	GPU (CUDA 11.x)	27 de julho de 2024	27 de julho de 2025
1.13 (Python 3.8)	Somente CPU	15 de maio de 2024	15 de maio de 2025
1.13 (Python 3.8)	GPU (CUDA 11.x)	15 de maio de 2024	15 de maio de 2025
1.12	Somente CPU	15 de maio de 2024	15 de maio de 2025
1.12	GPU (CUDA 11.x)	15 de maio de 2024	15 de maio de 2025
1.11	Somente CPU	15 de maio de 2024	15 de maio de 2025
1.11	GPU (CUDA 11.x)	15 de maio de 2024	15 de maio de 2025

scikit-learn

Imagens de contêiner do scikit-learn disponíveis (clique para abrir)

Versão do framework de MLs	Aceleradores compatíveis (e a versão CUDA, se aplicável)	Fim do patch e da data de suporte	Fim da disponibilidade	Imagens compatíveis
1.6 (Python 3.10)	Somente CPU	14 de outubro de 2026	14 de outubro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-6:latest`
1.5 (Python 3.10)	Somente CPU	14 de julho de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-5:latest`
1.4 (Python 3.10)	Somente CPU	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest` `europe-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest` `asia-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.1-4:latest`
1.3 (Python 3.10)	Somente CPU	28 de novembro de 2024	28 de novembro de 2025
1.2 (Python 3.10)	Somente CPU	30 de junho de 2024	30 de junho de 2025
1,0	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
0,24	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
0.23	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
0,22	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
0,20	Somente CPU	15 de novembro de 2023	15 de novembro de 2024

XGBoost

Imagens de contêiner do XGBoost disponíveis (clique para expandir)

Versão do framework de MLs	Aceleradores compatíveis (e a versão CUDA, se aplicável)	Fim do patch e da data de suporte	Fim da disponibilidade	Imagens compatíveis
2.1 (Python 3.10)	Somente CPU	14 de julho de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest` `europe-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest` `asia-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-1:latest`
2.0 (Python 3.10)	Somente CPU	14 de janeiro de 2026	14 de janeiro de 2027	`us-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest` `europe-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest` `asia-docker.pkg.dev/vertex-ai/prediction/xgboost-cpu.2-0:latest`
1.7 (Python 3.10)	Somente CPU	30 de junho de 2024	30 de dezembro de 2025
1.6	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
1.5	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
1.4	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
1.3	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
1.2	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
1.1	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
0,90	Somente CPU	15 de novembro de 2023	15 de novembro de 2024
0,82	Somente CPU	15 de novembro de 2023	15 de novembro de 2024

Usar um contêiner predefinido

É possível especificar um contêiner predefinido para inferência quando você criar um recurso TrainingPipeline personalizado que faça upload de um Model ou quando importar artefatos de modelo como um Model.

Para usar um desses contêineres predefinidos, salve seu modelo como um ou mais artefatos de modelo que atendam aos requisitos do contêiner pré-criado. Para mais informações, consulte Exportar artefatos de modelo para inferência.

Os notebooks a seguir demonstram como usar um contêiner pré-criado para disponibilizar inferências.

O que você quer fazer?	Notebook
Treinar e exibir um modelo do TensorFlow usando um contêiner pré-criado	Treinamento personalizado e inferência on-line
Exibir um modelo do PyTorch usando um contêiner pré-criado	Como disponibilizar modelos de imagem do PyTorch com contêineres predefinidos na Agent Platform
Exibir um modelo de difusão estável usando um contêiner pré-criado	Implantar e hospedar um modelo de difusão estável na Agent Platform

Notebooks

A seguir

Saiba como implantar um modelo em um endpoint para disponibilizar inferências.