O Model Garden é uma biblioteca de modelos de IA/ML que ajuda a descobrir, testar, personalizar e implantar modelos e recursos do Google e dos parceiros do Google.
Vantagens do Model Garden
Ao trabalhar com modelos de IA, o Model Garden oferece as seguintes vantagens:
- Os modelos disponíveis são agrupados em um único local
- O Model Garden oferece um padrão de implantação consistente para diferentes tipos de modelos.
- O Model Garden oferece integração integrada com outras partes da Vertex AI, como ajuste, avaliação e disponibilização de modelos.
- A veiculação de modelos de IA generativa pode ser difícil. A Vertex AI cuida da implantação e veiculação de modelos para você.
Explorar modelos
Para conferir a lista de Vertex AI disponíveis e a base de código aberto, modelos ajustáveis e específicos de tarefas, acesse a página Model Garden no consoleGoogle Cloud .
As categorias de modelo disponíveis no Model Garden são:
| Categoria | Descrição |
|---|---|
| Modelos de fundação | Modelos pré-treinados de multitarefa que podem ser ajustados ou personalizados para tarefas específicas usando a Vertex AI Studio, a API Vertex AI e o SDK Vertex AI para Python. |
| Modelos ajustáveis | Modelos que podem ser ajustados com um notebook ou pipeline personalizado. |
| Soluções específicas para tarefas | A maioria desses modelos prontos está pronta para uso. Muitos podem ser personalizados usando seus próprios dados. |
Para filtrar modelos no painel de filtros, especifique o seguinte:
- Tarefas: clique na tarefa que você quer que o modelo execute.
- Coleções de modelos: clique para escolher modelos gerenciados pelo Google, parceiros ou você.
- Provedores: clique no provedor do modelo.
- Recursos: clique nos recursos que você quer no modelo.
Para saber mais sobre cada modelo, clique no card correspondente.
Para conferir uma lista de modelos disponíveis no Model Garden, consulte Modelos disponíveis no Model Garden.
Verificação de segurança do modelo
O Google faz testes e comparações de mercado completos nos contêineres de veiculação e ajuste que oferecemos. A verificação de vulnerabilidades ativa também é aplicada a artefatos de contêiner.
Os modelos de terceiros de parceiros em destaque passam por verificações de modelos para garantir a autenticidade. Os modelos de terceiros do HuggingFace Hub são verificados diretamente pelo HuggingFace e pelo verificador de terceiros em busca de malware, arquivos pickle, camadas Keras Lambda e segredos. Os modelos considerados inseguros por esses verificações são sinalizados pelo HuggingFace e bloqueados para implantação no Model Garden. Os modelos considerados suspeitos ou que têm a capacidade de executar código remoto são indicados no Model Garden, mas ainda podem ser implantados. Recomendamos que você faça uma revisão completa de qualquer modelo suspeito antes de implantá-lo no Model Garden.
Preços
Para os modelos de código aberto no Model Garden, a cobrança é feita pelo uso dos itens a seguir na Vertex AI:
- Ajuste do modelo: os recursos de computação usados são cobrados com a mesma taxa do treinamento personalizado. Consulte os preços de treinamento personalizado.
- Implantação do modelo: você é cobrado pelos recursos de computação usados para implantar o modelo em um endpoint. Consulte preços das previsões.
- Colab Enterprise: consulte os preços do Colab Enterprise.
Controlar o acesso a modelos específicos
É possível definir uma política de organização do Model Garden no nível da organização, da pasta ou do projeto para controlar o acesso a modelos específicos no Model Garden. Por exemplo, você pode permitir o acesso a modelos específicos que você verificou e negar o acesso a todos os outros.
Saiba mais sobre o Model Garden
Para mais informações sobre as opções de implantação e personalizações que você pode fazer com modelos no Model Garden, consulte os recursos nas seções a seguir, que incluem links para tutoriais, referências, notebooks e vídeos do YouTube.
Implantar e disponibilizar
Saiba mais sobre como personalizar implantações e recursos avançados de veiculação.
- Implantar e oferecer um modelo de código aberto usando o SDK do Python, a CLI, a API REST ou o console
- Como implantar e ajustar o Gemma 3 no vídeo do YouTube do Model Garden
- Implantar o Gemma e fazer previsões
- Disponibilizar modelos abertos com um contêiner Hex-LLM em Cloud TPUs
- Como implantar modelos de Llama usando o notebook de tutorial Hex-LLM
- Usar o armazenamento em cache de prefixo e a decodificação especulativa com o notebook de tutorial Hex-LLM ou vLLM
- Usar o vLLM para disponibilizar modelos de linguagem somente texto e multimodelo em GPUs do Cloud
- Usar o contêiner de veiculação de GPU do xDiT para geração de imagens e vídeos
- Servir o Gemma 2 com vários adaptadores LoRA com o DLC do HuggingFace para o tutorial de inferência do PyTorch no Medium
- Use identificadores personalizados para oferecer PaliGemma para legendas de imagens com o DLC do HuggingFace para o tutorial de inferência do PyTorch no LinkedIn
- Implantar e oferecer um modelo que usa VMs do Spot ou um notebook de tutorial de reserva do Compute Engine
- Implantar e exibir um modelo do HuggingFace
Ajuste
Saiba mais sobre como ajustar modelos para personalizar respostas para casos de uso específicos.
- Notebook de tutorial de ajuste fino do Workbench
- Notebook de tutorial de ajuste fino e avaliação
- Como implantar e ajustar o Gemma 3 no vídeo do YouTube do Model Garden
Avaliação
Saiba como avaliar as respostas do modelo com a Vertex AI
Outros recursos
- Modelos e cadernos do Model Garden específicos para a jornada do usuário
- Serviço de modelos abertos, ajuste fino e notebooks de avaliação da Vertex AI