Ajuste de texto

Esta página fornece pré-requisitos e instruções detalhadas para ajustar modelos do Gemini em dados de texto usando o aprendizado supervisionado.

Casos de uso

Com o ajuste de detalhes, é possível adaptar os modelos de base do Gemini para tarefas especializadas. Confira alguns casos de uso de texto:

  • Extrair informações estruturadas de chats: transforme conversas com várias mensagens em dados organizados ajustando um modelo para identificar os principais atributos e gerar saídas em um formato estruturado, como JSONL.
  • Categorização de documentos: ajuste um modelo para classificar com precisão documentos longos em categorias predefinidas, permitindo a organização e a recuperação eficientes de informações.
  • Seguir instruções: melhore a capacidade de um modelo de compreender e executar instruções, o que leva a uma conclusão de tarefas mais precisa e confiável.
  • Revisão automática de código: use o ajuste fino para criar um modelo capaz de fornecer revisões úteis de código, identificar possíveis problemas e sugerir melhorias.
  • Resumo: gere resumos concisos e informativos de textos longos ajustando um modelo para capturar a essência do conteúdo.
  • Geração de código e DSL: ajuste um modelo para gerar código em várias linguagens de programação ou em linguagens específicas de domínio (DSLs), automatizando tarefas de programação repetitivas.
  • Melhoria no desempenho da RAG: melhore a utilidade e a acurácia dos sistemas de geração aumentada por recuperação (RAG) ajustando o modelo de linguagem subjacente.

Formato do conjunto de dados

O fileUri do conjunto de dados pode ser o URI de um arquivo em um bucket do Cloud Storage ou um URL HTTP ou HTTPS disponível publicamente.

Confira a seguir um exemplo de conjunto de dados de texto.

Para conferir o exemplo de formato genérico, consulte Exemplo de conjunto de dados para o Gemini.

{
  "systemInstruction": {
    "role": "system",
    "parts": [
      {
        "text": "You are a pirate dog named Captain Barktholomew."
      }
    ]
  },
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hi"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "Argh! What brings ye to my ship?"
        }
      ]
    },
    {
      "role": "user",
      "parts": [
        {
          "text": "What's your name?"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
        }
      ]
    }
  ]
}

Conjuntos de dados de amostra

Use os conjuntos de dados de exemplo a seguir para aprender a ajustar um modelo do Gemini. Para usar esses conjuntos de dados, especifique os URIs nos parâmetros aplicáveis ao criar um job de ajuste supervisionado de modelo de texto.

Para usar o conjunto de dados de ajuste de amostra, especifique o local dele da seguinte maneira:

"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl",

Para usar o conjunto de dados de validação de amostra, especifique o local dele da seguinte maneira:

"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl",

A seguir