Introdução aos ajustes

O ajuste de modelos é um processo crucial na adaptação do Gemini para executar tarefas específicas com mais precisão. Ele funciona fornecendo a um modelo um conjunto de dados de treinamento que contém exemplos de tarefas downstream específicas.

Nesta página, você encontra uma visão geral do ajuste de modelos para o Gemini, uma descrição das opções disponíveis e ajuda para determinar quando cada opção de ajuste precisa ser usada.

Benefícios do ajuste de modelos

O ajuste de modelos é uma maneira eficaz de personalizar modelos grandes para suas tarefas. Essa é uma etapa fundamental para melhorar a qualidade e a eficiência do modelo. O ajuste de modelos oferece os seguintes benefícios:

  • Qualidade mais alta para suas tarefas específicas
  • Maior robustez de modelo
  • Menor latência e custo de inferência devido a comandos mais curtos

Ajuste comparado ao design de comandos

  • Comandos com modelos pré-treinados do Gemini: o comando é a arte de criar instruções eficazes para orientar modelos de IA, como o Gemini, na geração das respostas que você quer. Isso envolve criar comandos que transmitam claramente a tarefa, o formato desejado e qualquer contexto relevante. Você pode usar os recursos do Gemini com configuração mínima. Ele é mais adequado para:
    • Dados rotulados limitados: se você tiver uma pequena quantidade de dados rotulados ou não puder arcar com um processo de ajuste refinado longo.
    • Prototipagem rápida: quando você precisa testar rapidamente um conceito ou ter uma performance de base sem um grande investimento em ajuste fino.
  • Ajuste personalizado dos modelos do Gemini: para resultados mais personalizados, o Gemini permite ajustar os modelos nos seus conjuntos de dados específicos. Para criar um modelo de IA que se destaque no seu domínio específico, considere o ajuste. Isso envolve treinar novamente o modelo de base no seu próprio conjunto de dados rotulado, adaptando os pesos dele à sua tarefa e aos seus dados. Você pode adaptar o Gemini aos seus casos de uso. O ajuste é mais eficaz quando:
    • Você tem dados rotulados: um conjunto de dados considerável para treinamento (pense em 100 exemplos ou mais), o que permite que o modelo aprenda profundamente as especificidades da sua tarefa.
    • Tarefas complexas ou exclusivas: para cenários em que as estratégias avançadas de solicitação não são suficientes e um modelo adaptado aos seus dados é essencial.

Recomendamos começar com comandos para encontrar o ideal. Em seguida, passe para o ajuste fino (se necessário) para melhorar ainda mais a performance ou corrigir erros recorrentes. Embora adicionar mais exemplos possa ser benéfico, é importante avaliar onde o modelo comete erros antes de adicionar mais dados. Dados de alta qualidade e bem rotulados são cruciais para uma boa performance e melhores do que a quantidade. Além disso, os dados usados para ajuste fino precisam refletir a distribuição, o formato e o contexto do comando que o modelo vai encontrar na produção.

O ajuste oferece os seguintes benefícios em relação ao design de comandos:

  • Permite uma personalização profunda no modelo e resulta em melhor desempenho em tarefas específicas.
  • Alinhe o modelo com sintaxe, instruções e regras semânticas específicas do domínio.
  • Oferece resultados mais consistentes e confiáveis.
  • Capaz de processar mais exemplos de uma só vez.
  • Economize custos na inferência removendo exemplos de poucos disparos e instruções longas nos comandos

Abordagens de ajuste

O ajuste com eficiência de parâmetros e o ajuste fino completo são duas abordagens para personalizar modelos grandes. Ambos os métodos têm vantagens e implicações em termos de qualidade do modelo e eficiência de recursos.

O ajuste da eficiência dos parâmetros

O ajuste da eficiência de parâmetros, também chamado de ajuste do adaptador, permite a adaptação eficiente de modelos grandes para tarefas ou domínios específicos. O ajuste eficiente de parâmetros atualiza um subconjunto relativamente pequeno de parâmetros do modelo durante o processo de ajuste.

Para entender como a Gemini Enterprise Agent Platform oferece suporte ao ajuste e à disponibilização de adaptadores, confira mais detalhes neste artigo: Adaptação de modelos de fundação grandes.

Ajuste completo

O ajuste completo atualiza todos os parâmetros do modelo, o que o torna adequado para adaptá-lo a tarefas altamente complexas, com o potencial de alcançar maior qualidade. No entanto, o ajuste fino completo exige recursos computacionais mais altos para ajuste e disponibilização, levando a custos gerais mais altos.

O ajuste da eficiência dos parâmetros em comparação com o ajuste fino completo

O ajuste com eficiência de parâmetros é mais econômico em comparação com o ajuste fino completo. Ele usa recursos computacionais significativamente menores para treinamento. Ele adapta o modelo mais rapidamente com um conjunto de dados menor. A flexibilidade do ajuste de eficiência de parâmetros oferece uma solução para o aprendizado de várias tarefas sem a necessidade de um retreinamento extensivo.

Métodos de ajuste com suporte

O Agent Platform oferece suporte ao ajuste supervisionado para personalizar modelos de fundação.

Ajuste supervisionado

O ajuste supervisionado melhora o desempenho do modelo ensinando uma nova habilidade. Dados que contêm centenas de exemplos rotulados são usados para ensinar o modelo a imitar um comportamento ou tarefa desejado. Cada exemplo rotulado demonstra o que você quer que o modelo produza durante a inferência.

Ao executar um job de ajuste supervisionado, o modelo aprende outros parâmetros que o ajudam a codificar as informações necessárias para realizar a tarefa desejada ou aprender o comportamento desejado. Esses parâmetros são usados durante a inferência. A saída do job de ajuste é um novo modelo que combina os parâmetros recém-aprendidos com o modelo original.

O ajuste supervisionado de um modelo de texto é uma boa opção quando a saída do modelo não é complexa e é relativamente fácil de definir. O ajuste supervisionado é recomendado para classificação, análise de sentimento, extração de entidade, resumo de conteúdo não complexo e gravação de consultas específicas de domínio. Para modelos de código, o ajuste supervisionado é a única opção.

Modelos com suporte para ajuste supervisionado

Os seguintes modelos do Gemini são compatíveis com ajuste supervisionado:

Clique para abrir os modelos compatíveis

Para mais informações sobre como usar o ajuste supervisionado em cada modelo, consulte as seguintes páginas: ajuste os tipos de dados texto, imagem, áudio e documento.

Ajuste de preferências

O ajuste de preferências da Gemini Enterprise Agent Platform se baseia no ajuste supervisionado, permitindo que você ajuste seus modelos do Gemini com dados de feedback humano.

Com o ajuste de preferências, o modelo aprende com preferências subjetivas do usuário, que são difíceis de definir usando apenas rótulos específicos e ajuste supervisionado.

Modelos compatíveis com o ajuste de preferências

Os seguintes modelos do Gemini são compatíveis com o ajuste de preferências:

Clique para abrir os modelos compatíveis

Para mais informações sobre o ajuste de preferências, consulte Sobre o ajuste de preferências para modelos do Gemini.

Ajustar checkpoints

Com eles, é possível salvar o progresso do ajuste, comparar a performance dos checkpoints e escolher o que tem o melhor desempenho.

Modelos compatíveis com checkpoints de ajuste

Os seguintes modelos do Gemini são compatíveis com pontos de verificação de ajuste:

Clique para abrir os modelos compatíveis

Para mais informações sobre pontos de verificação de ajuste, consulte Usar pontos de verificação no ajuste do Gemini.

Ajuste contínuo

Com o ajuste contínuo, é possível continuar ajustando um modelo ou um ponto de verificação de modelo já ajustado adicionando mais épocas ou exemplos de treinamento.

Modelos compatíveis com o ajuste contínuo

Os seguintes modelos do Gemini são compatíveis com o ajuste contínuo:

Clique para abrir os modelos compatíveis

Para mais informações sobre o ajuste contínuo, consulte Sobre o ajuste contínuo para modelos do Gemini.

A seguir