O Model Garden é uma biblioteca de modelos de IA/ML que ajuda a descobrir, testar, personalizar e implantar modelos e recursos do Google e de parceiros do Google.
Vantagens do Model Garden
Ao trabalhar com modelos de IA, o Model Garden oferece as seguintes vantagens:
- Todos os modelos disponíveis estão agrupados em um único local
- O Model Garden oferece um padrão de implantação consistente para diferentes tipos de modelos.
- O Model Garden oferece integração integrada com outras partes da plataforma de agentes do Gemini Enterprise, como ajuste, avaliação e exibição de modelos.
- A disponibilização de modelos de IA generativa pode ser difícil. A Agent Platform do Gemini Enterprise cuida da implantação e da disponibilização de modelos para você.
Explorar modelos
Para conferir a lista de modelos disponíveis da plataforma de agentes do Gemini Enterprise e de código aberto de fundação, ajustáveis e específicos de tarefas, acesse a página do Model Garden no Google Cloud console.
As categorias de modelo disponíveis no Model Garden são:
| Categoria | Descrição |
|---|---|
| Modelos de fundação | Modelos pré-treinados de multitarefa que podem ser ajustados ou personalizados para tarefas específicas usando o Agent Studio, a API Agent Platform e o SDK Agent Platform. |
| Modelos ajustáveis | Modelos que podem ser ajustados com um notebook ou pipeline personalizado. |
| Soluções específicas para tarefas | A maioria desses modelos prontos está pronta para uso. Muitos podem ser personalizados usando seus próprios dados. |
Para filtrar modelos no painel de filtros, especifique o seguinte:
- Tarefas: clique na tarefa que você quer que o modelo execute.
- Coleções de modelos: clique para escolher modelos gerenciados pelo Google, parceiros ou você.
- Provedores: clique no provedor do modelo.
- Recursos: clique nos recursos que você quer no modelo.
Para saber mais sobre cada modelo, clique no card correspondente.
Para conferir uma lista de modelos disponíveis no Model Garden, consulte Modelos disponíveis no Model Garden.
Verificação de segurança do modelo
O Google realiza testes e comparativos de mercado completos nos contêineres de veiculação e ajuste que oferecemos. A verificação ativa de vulnerabilidades também é aplicada a artefatos de contêiner.
Os modelos de terceiros de parceiros em destaque passam por verificações de checkpoint para garantir a autenticidade. Os modelos de terceiros do HuggingFace Hub são verificados diretamente pelo HuggingFace e pelo scanner de terceiros (link em inglês) em busca de malware, arquivos pickle, camadas Keras Lambda e segredos. Os modelos considerados inseguros por essas verificações são sinalizados pelo Hugging Face e bloqueados para implantação no Model Garden. Os modelos considerados suspeitos ou que têm a capacidade de executar código remoto são indicados no Model Garden, mas ainda podem ser implantados. Recomendamos que você faça uma análise completa de qualquer modelo suspeito antes de implantá-lo no Model Garden.
Preços
Para os modelos de código aberto no Model Garden, a cobrança é feita pelo uso dos itens a seguir na plataforma de agentes do Gemini Enterprise:
- Ajuste do modelo: os recursos de computação usados são cobrados com a mesma taxa do treinamento personalizado. Consulte os preços de treinamento personalizado.
- Implantação do modelo: você é cobrado pelos recursos de computação usados para implantar o modelo em um endpoint. Consulte preços das previsões.
- Colab Enterprise: consulte os preços do Colab Enterprise.
Controlar o acesso a modelos específicos
É possível definir uma política de organização do Model Garden no nível da organização, da pasta ou do projeto para controlar o acesso a modelos específicos no Model Garden. Por exemplo, você pode permitir o acesso a modelos específicos que foram verificados e negar o acesso a todos os outros.
Saiba mais sobre o Model Garden
Para mais informações sobre as opções de implantação e personalizações que você pode fazer com os modelos no Model Garden, consulte os recursos nas seções a seguir, que incluem links para tutoriais, referências, notebooks e vídeos do YouTube.
Implantar e disponibilizar
Saiba mais sobre como personalizar implantações e recursos avançados de veiculação.
- Implante e disponibilize um modelo de código aberto usando o SDK do Python, a CLI, a API REST ou o console
- Vídeo do YouTube sobre como implantar e ajustar o Gemma 3 no Model Garden
- Como implantar o Gemma e fazer previsões
- Disponibilize modelos abertos com um contêiner Hex-LLM em Cloud TPUs
- Notebook do tutorial sobre como implantar modelos Llama usando o Hex-LLM
- Notebook do tutorial "Usar o armazenamento em cache de prefixos e a decodificação especulativa com Hex-LLM ou vLLM"
- Use o vLLM para disponibilizar modelos de linguagem somente de texto e multimodal em Cloud GPUs
- Usar o contêiner de exibição de GPU do xDiT para gerar imagens e vídeos
- Tutorial no Medium sobre como disponibilizar o Gemma 2 com vários adaptadores LoRA e o DLC HuggingFace para inferência do PyTorch
- Use identificadores personalizados para disponibilizar o PaliGemma para legendagem de imagens com o Conteúdo baixado do HuggingFace para o tutorial de inferência do PyTorch no LinkedIn
- Implante e disponibilize um modelo que usa VMs Spot ou um notebook de tutorial de reserva do Compute Engine
- Implantar e disponibilizar um modelo do HuggingFace
Ajuste
Saiba mais sobre o ajuste de modelos para personalizar respostas em casos de uso específicos.
- Notebook do tutorial de ajuste do Workbench
- Notebook do tutorial de ajuste e avaliação
- Vídeo do YouTube sobre como implantar e ajustar o Gemma 3 no Model Garden
Avaliação
Saiba mais sobre como avaliar respostas de modelos com a plataforma de agentes
Outros recursos
- Notebooks do Model Garden específicos do modelo e da jornada do usuário
- Notebooks de disponibilização do modelo, ajuste e avaliação de modelos abertos da plataforma de agentes do Gemini Enterprise