Ajuste de texto

Esta página fornece pré-requisitos e instruções detalhadas para o ajuste preciso do Gemini em dados de texto através da aprendizagem supervisionada. Para ver exemplos de ajuste de texto de classificação, análise de sentimentos e exemplos de utilização de extração, consulte o artigo Ajuste de modelos para modelos de texto do Gemini.

Exemplos de utilização

A otimização permite-lhe adaptar os modelos Gemini base para tarefas especializadas. Seguem-se alguns exemplos de utilização de texto:

  • Extrair informações estruturadas de chats: transforme conversas de várias interações em dados organizados através da otimização de um modelo para identificar atributos importantes e enviá-los num formato estruturado, como JSONL.
  • Categorização de documentos: ajuste um modelo para classificar com precisão documentos longos em categorias predefinidas, o que permite uma organização e uma obtenção de informações eficientes.
  • Seguir instruções: melhora a capacidade de um modelo compreender e executar instruções, o que leva a uma conclusão de tarefas mais precisa e fiável.
  • Revisão de código automatizada: use o ajuste fino para criar um modelo capaz de fornecer revisões de código detalhadas, identificar potenciais problemas e sugerir melhorias.
  • Resumo: gere resumos concisos e informativos de textos longos através da otimização de um modelo para captar a essência do conteúdo.
  • Geração de código e DSL: ajuste um modelo para gerar código em várias linguagens de programação ou linguagens específicas do domínio (DSLs), automatizando tarefas de programação repetitivas.
  • Desempenho da RAG melhorado: melhore a utilidade e a precisão dos sistemas de geração aumentada por obtenção (RAG) através da otimização do modelo de linguagem subjacente.

Formato do conjunto de dados

O fileUri do conjunto de dados pode ser o URI de um ficheiro num contentor do Cloud Storage ou pode ser um URL HTTP ou HTTPS disponível publicamente.

Segue-se um exemplo de um conjunto de dados de texto.

Para ver o exemplo de formato genérico, consulte o Exemplo de conjunto de dados para o Gemini.

{
  "systemInstruction": {
    "role": "system",
    "parts": [
      {
        "text": "You are a pirate dog named Captain Barktholomew."
      }
    ]
  },
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hi"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "Argh! What brings ye to my ship?"
        }
      ]
    },
    {
      "role": "user",
      "parts": [
        {
          "text": "What's your name?"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
        }
      ]
    }
  ]
}

Conjuntos de dados de amostragem

Pode usar os seguintes conjuntos de dados de exemplo para saber como otimizar um modelo do Gemini. Para usar estes conjuntos de dados, especifique os URIs nos parâmetros aplicáveis quando criar uma tarefa de ajuste fino supervisionado de um modelo de texto.

Para usar o conjunto de dados de ajuste de amostra, especifique a respetiva localização da seguinte forma:

"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl",

Para usar o conjunto de dados de validação de exemplo, especifique a respetiva localização da seguinte forma:

"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl",

O que se segue?