O ajuste de modelos é um processo crucial na adaptação do Gemini para executar tarefas específicas com mais precisão. Ele funciona fornecendo a um modelo um conjunto de dados de treinamento que contém exemplos de tarefas downstream específicas.
Nesta página, você encontra uma visão geral do ajuste de modelos para o Gemini, uma descrição das opções disponíveis e ajuda para determinar quando cada opção de ajuste precisa ser usada.
Benefícios do ajuste de modelos
O ajuste de modelos é uma maneira eficaz de personalizar modelos grandes para suas tarefas. Essa é uma etapa fundamental para melhorar a qualidade e a eficiência do modelo. O ajuste de modelos oferece os seguintes benefícios:
- Qualidade mais alta para suas tarefas específicas
- Maior robustez de modelo
- Menor latência e custo de inferência devido a comandos mais curtos
Ajuste comparado ao design de comandos
- Comandos com modelos pré-treinados do Gemini: o comando é a arte de criar instruções eficazes para orientar modelos de IA, como o Gemini, na geração das respostas que você quer. Isso envolve criar comandos que
transmitam claramente a tarefa, o formato desejado e qualquer contexto relevante. Você pode usar os recursos do Gemini com configuração mínima. Ele é mais adequado para:
- Dados rotulados limitados: se você tiver uma pequena quantidade de dados rotulados ou não puder arcar com um processo de ajuste refinado longo.
- Prototipagem rápida: quando você precisa testar rapidamente um conceito ou ter uma performance de base sem um grande investimento em ajuste fino.
- Ajuste personalizado dos modelos do Gemini: para resultados mais personalizados, o Gemini permite ajustar os modelos nos seus conjuntos de dados específicos. Para criar um modelo de IA que se destaque no seu domínio específico, considere o ajuste. Isso envolve treinar novamente o modelo de base no seu próprio conjunto de dados rotulado, adaptando os pesos dele à sua tarefa e aos seus dados. Você pode adaptar o Gemini aos seus casos de uso. O ajuste é mais eficaz quando:
- Você tem dados rotulados: um conjunto de dados considerável para treinamento (pense em 100 exemplos ou mais), o que permite que o modelo aprenda profundamente as especificidades da sua tarefa.
- Tarefas complexas ou exclusivas: para cenários em que as estratégias avançadas de solicitação não são suficientes e um modelo adaptado aos seus dados é essencial.
Recomendamos começar com comandos para encontrar o ideal. Em seguida, passe para o ajuste fino (se necessário) para melhorar ainda mais a performance ou corrigir erros recorrentes. Embora adicionar mais exemplos possa ser benéfico, é importante avaliar onde o modelo comete erros antes de adicionar mais dados. Dados de alta qualidade e bem rotulados são cruciais para uma boa performance e melhores do que a quantidade. Além disso, os dados usados para ajuste fino precisam refletir a distribuição, o formato e o contexto do comando que o modelo vai encontrar na produção.
O ajuste oferece os seguintes benefícios em relação ao design de comandos:
- Permite uma personalização profunda no modelo e resulta em melhor desempenho em tarefas específicas.
- Alinhe o modelo com sintaxe, instruções e regras semânticas específicas do domínio.
- Oferece resultados mais consistentes e confiáveis.
- Capaz de processar mais exemplos de uma só vez.
- Economize custos na inferência removendo exemplos de poucos disparos e instruções longas nos comandos
Abordagens de ajuste
O ajuste com eficiência de parâmetros e o ajuste fino completo são duas abordagens para personalizar modelos grandes. Ambos os métodos têm vantagens e implicações em termos de qualidade do modelo e eficiência de recursos.
O ajuste da eficiência dos parâmetros
O ajuste da eficiência de parâmetros, também chamado de ajuste do adaptador, permite a adaptação eficiente de modelos grandes para tarefas ou domínios específicos. O ajuste eficiente de parâmetros atualiza um subconjunto relativamente pequeno de parâmetros do modelo durante o processo de ajuste.
Para entender como a Gemini Enterprise Agent Platform oferece suporte ao ajuste e à disponibilização de adaptadores, confira mais detalhes neste artigo: Adaptação de modelos de fundação grandes.
Ajuste completo
O ajuste completo atualiza todos os parâmetros do modelo, o que o torna adequado para adaptá-lo a tarefas altamente complexas, com o potencial de alcançar maior qualidade. No entanto, o ajuste fino completo exige recursos computacionais mais altos para ajuste e disponibilização, levando a custos gerais mais altos.
O ajuste da eficiência dos parâmetros em comparação com o ajuste fino completo
O ajuste com eficiência de parâmetros é mais econômico em comparação com o ajuste fino completo. Ele usa recursos computacionais significativamente menores para treinamento. Ele adapta o modelo mais rapidamente com um conjunto de dados menor. A flexibilidade do ajuste de eficiência de parâmetros oferece uma solução para o aprendizado de várias tarefas sem a necessidade de um retreinamento extensivo.
Métodos de ajuste com suporte
O Agent Platform oferece suporte ao ajuste supervisionado para personalizar modelos de fundação.
Ajuste supervisionado
O ajuste supervisionado melhora o desempenho do modelo ensinando uma nova habilidade. Dados que contêm centenas de exemplos rotulados são usados para ensinar o modelo a imitar um comportamento ou tarefa desejado. Cada exemplo rotulado demonstra o que você quer que o modelo produza durante a inferência.
Ao executar um job de ajuste supervisionado, o modelo aprende outros parâmetros que o ajudam a codificar as informações necessárias para realizar a tarefa desejada ou aprender o comportamento desejado. Esses parâmetros são usados durante a inferência. A saída do job de ajuste é um novo modelo que combina os parâmetros recém-aprendidos com o modelo original.
O ajuste supervisionado de um modelo de texto é uma boa opção quando a saída do modelo não é complexa e é relativamente fácil de definir. O ajuste supervisionado é recomendado para classificação, análise de sentimento, extração de entidade, resumo de conteúdo não complexo e gravação de consultas específicas de domínio. Para modelos de código, o ajuste supervisionado é a única opção.
Modelos com suporte para ajuste supervisionado
Os seguintes modelos do Gemini são compatíveis com ajuste supervisionado:
Clique para abrir os modelos compatíveis
Para mais informações sobre como usar o ajuste supervisionado em cada modelo, consulte as seguintes páginas: ajuste os tipos de dados texto, imagem, áudio e documento.
Ajuste de preferências
O ajuste de preferências da Gemini Enterprise Agent Platform se baseia no ajuste supervisionado, permitindo que você ajuste seus modelos do Gemini com dados de feedback humano.
Com o ajuste de preferências, o modelo aprende com preferências subjetivas do usuário, que são difíceis de definir usando apenas rótulos específicos e ajuste supervisionado.
Modelos compatíveis com o ajuste de preferências
Os seguintes modelos do Gemini são compatíveis com o ajuste de preferências:
Clique para abrir os modelos compatíveis
Para mais informações sobre o ajuste de preferências, consulte Sobre o ajuste de preferências para modelos do Gemini.
Ajustar checkpoints
Com eles, é possível salvar o progresso do ajuste, comparar a performance dos checkpoints e escolher o que tem o melhor desempenho.
Modelos compatíveis com checkpoints de ajuste
Os seguintes modelos do Gemini são compatíveis com pontos de verificação de ajuste:
Clique para abrir os modelos compatíveis
Para mais informações sobre pontos de verificação de ajuste, consulte Usar pontos de verificação no ajuste do Gemini.
Ajuste contínuo
Com o ajuste contínuo, é possível continuar ajustando um modelo ou um ponto de verificação de modelo já ajustado adicionando mais épocas ou exemplos de treinamento.
Modelos compatíveis com o ajuste contínuo
Os seguintes modelos do Gemini são compatíveis com o ajuste contínuo:
Clique para abrir os modelos compatíveis
Para mais informações sobre o ajuste contínuo, consulte Sobre o ajuste contínuo para modelos do Gemini.
A seguir
- Saiba mais sobre o ajuste refinado supervisionado.
- Saiba mais sobre o ajuste de preferências.
- Para começar a ajustar, consulte Ajustar modelos do Gemini usando ajuste supervisionado de detalhes.
- Para saber como o ajuste supervisionado de detalhes pode ser usado em uma solução que cria uma base de conhecimento de IA generativa, consulte Solução de início rápido: base de conhecimento de IA generativa.
- Para saber mais sobre os custos de ajuste, consulte Preços.