O Model Garden é uma biblioteca de modelos de IA/ML que ajuda a descobrir, testar, personalizar e implantar modelos e recursos do Google e de parceiros.
Vantagens do Model Garden
Ao trabalhar com modelos de IA, o Model Garden oferece as seguintes vantagens:
- Todos os modelos disponíveis são agrupados em um único local
- O Model Garden oferece um padrão de implantação consistente para diferentes tipos de modelos
- O Model Garden oferece integração integrada com outras partes da Gemini Enterprise Agent Platform, como ajuste, avaliação e veiculação de modelos
- A veiculação de modelos de IA generativa pode ser difícil. A Gemini Enterprise Agent Platform processa a implantação e a veiculação de modelos para você
Explorar modelos
Para conferir a lista dos modelos (de fundação, ajustáveis e para tarefas específicas) da plataforma de agentes do Gemini Enterprise e de código aberto, acesse a página Model Garden no Google Cloud console.
As categorias de modelo disponíveis no Model Garden são:
| Categoria | Descrição |
|---|---|
| Modelos de fundação | Modelos pré-treinados de multitarefa que podem ser ajustados ou personalizados para tarefas específicas usando o Agent Studio, a API Agent Platform e o SDK Agent Platform. |
| Modelos ajustáveis | Modelos que podem ser ajustados com um notebook ou pipeline personalizado. |
| Soluções específicas para tarefas | A maioria desses modelos prontos está pronta para uso. Muitos podem ser personalizados usando seus próprios dados. |
Para filtrar modelos no painel de filtros, especifique o seguinte:
- Tarefas: clique na tarefa que você quer que o modelo execute.
- Coleções de modelos: clique para escolher modelos gerenciados pelo Google, parceiros ou você.
- Provedores: clique no provedor do modelo.
- Recursos: clique nos recursos que você quer no modelo.
Para saber mais sobre cada modelo, clique no card de modelo correspondente.
Verificação de segurança do modelo
O Google realiza testes e benchmarking completos nos contêineres de veiculação e ajuste que oferecemos. A verificação ativa de vulnerabilidades também é aplicada a artefatos de contêiner.
Os modelos de terceiros de parceiros em destaque passam por verificações de checkpoint para garantir a autenticidade. Os modelos de terceiros do HuggingFace Hub são verificados diretamente pelo HuggingFace e pelo scanner de terceiros para detectar malware, arquivos pickle, camadas Keras Lambda e secrets. Os modelos considerados inseguros nessas verificações são sinalizados pelo HuggingFace e bloqueados para implantação no Model Garden. Os modelos considerados suspeitos ou que têm a capacidade de executar código remoto são indicados no Model Garden, mas ainda podem ser implantados. Recomendamos que você faça uma análise completa de qualquer modelo suspeito antes de implantá-lo no Model Garden.
Preços
Para os modelos de código aberto no Model Garden, a cobrança é feita pelo uso dos itens a seguir na plataforma de agentes do Gemini Enterprise:
- Ajuste do modelo: os recursos de computação usados são cobrados com a mesma taxa do treinamento personalizado. Consulte os preços de treinamento personalizado.
- Implantação do modelo: você é cobrado pelos recursos de computação usados para implantar o modelo em um endpoint. Consulte preços das previsões.
- Colab Enterprise: consulte os preços do Colab Enterprise.
Controlar o acesso a modelos específicos
É possível definir uma política de organização do Model Garden no nível da organização, pasta ou projeto para controlar o acesso a modelos específicos no Model Garden. Por exemplo, você pode permitir o acesso a modelos específicos que foram verificados e negar o acesso a todos os outros.
Saiba mais sobre o Model Garden
Para mais informações sobre as opções de implantação e personalizações que podem ser feitas com modelos no Model Garden, consulte os recursos nas seções a seguir, que incluem links para tutoriais, referências, notebooks e vídeos do YouTube.
Implantar e disponibilizar
Saiba mais sobre como personalizar implantações e recursos avançados de veiculação.
- Implantar e disponibilizar um modelo de código aberto usando o SDK do Python, a CLI, a API REST ou o console
- Vídeo do YouTube sobre como implantar e ajustar o Gemma 3 no Model Garden
- Como implantar o Gemma e fazer previsões
- Disponibilizar modelos abertos com um contêiner Hex-LLM em Cloud TPUs
- Notebook do tutorial sobre como implantar modelos Llama usando o Hex-LLM
- Notebook do tutorial sobre como usar o armazenamento em cache de prefixos e a decodificação especulativa com Hex-LLM ou vLLM
- Usar o vLLM para disponibilizar modelos de linguagem somente de texto e multimodais em Cloud GPUs
- Usar o contêiner de exibição de GPU do xDiT para gerar imagens e vídeos
- Tutorial no Medium sobre como disponibilizar o Gemma 2 com vários adaptadores LoRA e o DLC HuggingFace para inferência do PyTorch
- Usar identificadores personalizados para disponibilizar o PaliGemma para legendagem de imagens com o DLC HuggingFace para o tutorial de inferência do PyTorch no LinkedIn
- Implantar e disponibilizar um modelo que usa VMs Spot ou um notebook de tutorial de reserva do Compute Engine
- Implantar e disponibilizar um modelo do HuggingFace
Ajuste
Saiba mais sobre como ajustar modelos para personalizar respostas para casos de uso específicos.
- Notebook do tutorial de ajuste do Workbench
- Notebook do tutorial de ajuste e avaliação
- Vídeo do YouTube sobre como implantar e ajustar o Gemma 3 no Model Garden
Avaliação
Saiba mais sobre como avaliar respostas de modelos com a Agent Platform
Outros recursos
- Os notebooks do Model Garden específicos do modelo e da jornada do usuário
- Notebooks de veiculação, ajuste e avaliação de modelos abertos da plataforma de agentes do Gemini Enterprise