O Model Garden é uma biblioteca de modelos de IA/ML que ajuda a descobrir, testar, personalizar e implantar modelos e recursos do Google e de parceiros do Google.
Vantagens do Model Garden
Ao trabalhar com modelos de IA, o Model Garden oferece as seguintes vantagens:
- Todos os modelos disponíveis estão agrupados em um único local
- O Model Garden oferece um padrão de implantação consistente para diferentes tipos de modelos.
- O Model Garden oferece integração integrada com outras partes da Vertex AI, como ajuste, avaliação e disponibilização de modelos.
- A veiculação de modelos de IA generativa pode ser difícil. A Vertex AI cuida da implantação e da veiculação de modelos para você.
Explorar modelos
Para conferir a lista de modelos da Vertex AI e de código aberto disponíveis, ajustáveis e específicos de tarefas, acesse a página do Model Garden noGoogle Cloud console.
As categorias de modelo disponíveis no Model Garden são:
Categoria | Descrição |
---|---|
Modelos de fundação | Modelos pré-treinados de multitarefa que podem ser ajustados ou personalizados para tarefas específicas usando a Vertex AI Studio, a API Vertex AI e o SDK Vertex AI para Python. |
Modelos ajustáveis | Modelos que podem ser ajustados com um notebook ou pipeline personalizado. |
Soluções específicas para tarefas | A maioria desses modelos prontos está pronta para uso. Muitos podem ser personalizados usando seus próprios dados. |
Para filtrar modelos no painel de filtros, especifique o seguinte:
- Tarefas: clique na tarefa que você quer que o modelo execute.
- Coleções de modelos: clique para escolher modelos gerenciados pelo Google, parceiros ou você.
- Provedores: clique no provedor do modelo.
- Recursos: clique nos recursos que você quer no modelo.
Para saber mais sobre cada modelo, clique no card correspondente.
Para conferir uma lista de modelos disponíveis no Model Garden, consulte Modelos disponíveis no Model Garden.
Verificação de segurança do modelo
O Google realiza testes e comparativos de mercado completos nos contêineres de veiculação e ajuste que oferecemos. A verificação ativa de vulnerabilidades também é aplicada a artefatos de contêiner.
Os modelos de terceiros de parceiros em destaque passam por verificações de checkpoint para garantir a autenticidade. Os modelos de terceiros do HuggingFace Hub são verificados diretamente pelo HuggingFace e pelo scanner de terceiros em busca de malware, arquivos pickle, camadas Keras Lambda e secrets. Os modelos considerados inseguros por essas verificações são sinalizados pelo Hugging Face e bloqueados para implantação no Model Garden. Os modelos considerados suspeitos ou que têm a capacidade de executar código remoto são indicados no Model Garden, mas ainda podem ser implantados. Recomendamos que você faça uma análise completa de qualquer modelo suspeito antes de implantá-lo no Model Garden.
Preços
Para os modelos de código aberto no Model Garden, a cobrança é feita pelo uso dos itens a seguir na Vertex AI:
- Ajuste do modelo: os recursos de computação usados são cobrados com a mesma taxa do treinamento personalizado. Consulte os preços de treinamento personalizado.
- Implantação do modelo: você é cobrado pelos recursos de computação usados para implantar o modelo em um endpoint. Consulte preços das previsões.
- Colab Enterprise: consulte os preços do Colab Enterprise.
Controlar o acesso a modelos específicos
É possível definir uma política de organização do Model Garden no nível da organização, da pasta ou do projeto para controlar o acesso a modelos específicos no Model Garden. Por exemplo, você pode permitir o acesso a modelos específicos que foram verificados e negar o acesso a todos os outros.
Saiba mais sobre o Model Garden
Para mais informações sobre as opções de implantação e personalizações que você pode fazer com os modelos no Model Garden, consulte os recursos nas seções a seguir, que incluem links para tutoriais, referências, notebooks e vídeos do YouTube.
Implantar e disponibilizar
Saiba mais sobre como personalizar implantações e recursos avançados de veiculação.
- Implante e disponibilize um modelo de código aberto usando o SDK do Python, a CLI, a API REST ou o console
- Vídeo do YouTube sobre como implantar e ajustar o Gemma 3 no Model Garden
- Como implantar o Gemma e fazer previsões
- Disponibilize modelos abertos com um contêiner Hex-LLM em Cloud TPUs
- Notebook do tutorial sobre como implantar modelos Llama usando o Hex-LLM
- Notebook do tutorial "Usar o armazenamento em cache de prefixos e a decodificação especulativa com Hex-LLM ou vLLM"
- Use o vLLM para disponibilizar modelos de linguagem somente de texto e multimodal em GPUs do Cloud
- Usar o contêiner de exibição de GPU do xDiT para gerar imagens e vídeos
- Tutorial no Medium sobre como disponibilizar o Gemma 2 com vários adaptadores LoRA e o DLC HuggingFace para inferência do PyTorch
- Use manipuladores personalizados e exiba o PaliGemma para legendagem de imagens com o DLC HuggingFace para o tutorial de inferência do PyTorch no LinkedIn
- Implante e execute um modelo que usa VMs Spot ou um notebook de tutorial de reserva do Compute Engine
- Implante e mostre um modelo do HuggingFace
Compliance de contêineres
O Model Garden oferece os seguintes contêineres compatíveis com o FedRAMP High para disponibilização de modelos.
Ajuste
Saiba mais sobre o ajuste de modelos para personalizar respostas em casos de uso específicos.
- Notebook do tutorial de ajuste do Workbench
- Notebook do tutorial de ajuste e avaliação
- Vídeo do YouTube sobre como implantar e ajustar o Gemma 3 no Model Garden
Avaliação
Saiba como avaliar respostas de modelos com a Vertex AI
Outros recursos
- Notebooks do Model Garden específicos do modelo e da jornada do usuário
- Notebooks da Vertex AI para disponibilização, ajuste e avaliação de modelos abertos