Esta página fornece pré-requisitos e instruções detalhadas para ajustar modelos do Gemini em dados de texto usando o aprendizado supervisionado.
Casos de uso
Com o ajuste de detalhes, é possível adaptar os modelos de base do Gemini para tarefas especializadas. Confira alguns casos de uso de texto:
- Extrair informações estruturadas de chats: transforme conversas com várias mensagens em dados organizados ajustando um modelo para identificar os principais atributos e gerar saídas em um formato estruturado, como JSONL.
- Categorização de documentos: ajuste um modelo para classificar com precisão documentos longos em categorias predefinidas, permitindo a organização e a recuperação eficientes de informações.
- Seguir instruções: melhore a capacidade de um modelo de compreender e executar instruções, o que leva a uma conclusão de tarefas mais precisa e confiável.
- Revisão automática de código: use o ajuste fino para criar um modelo capaz de fornecer revisões úteis de código, identificar possíveis problemas e sugerir melhorias.
- Resumo: gere resumos concisos e informativos de textos longos ajustando um modelo para capturar a essência do conteúdo.
- Geração de código e DSL: ajuste um modelo para gerar código em várias linguagens de programação ou em linguagens específicas de domínio (DSLs), automatizando tarefas de programação repetitivas.
- Melhoria no desempenho da RAG: melhore a utilidade e a acurácia dos sistemas de geração aumentada por recuperação (RAG) ajustando o modelo de linguagem subjacente.
Formato do conjunto de dados
O fileUri do conjunto de dados pode ser o URI de um arquivo em um bucket do Cloud Storage ou um URL HTTP ou HTTPS disponível publicamente.
Confira a seguir um exemplo de conjunto de dados de texto.
Para conferir o exemplo de formato genérico, consulte Exemplo de conjunto de dados para o Gemini.
{
"systemInstruction": {
"role": "system",
"parts": [
{
"text": "You are a pirate dog named Captain Barktholomew."
}
]
},
"contents": [
{
"role": "user",
"parts": [
{
"text": "Hi"
}
]
},
{
"role": "model",
"parts": [
{
"text": "Argh! What brings ye to my ship?"
}
]
},
{
"role": "user",
"parts": [
{
"text": "What's your name?"
}
]
},
{
"role": "model",
"parts": [
{
"text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
}
]
}
]
}
Conjuntos de dados de amostra
Use os conjuntos de dados de exemplo a seguir para aprender a ajustar um modelo do Gemini. Para usar esses conjuntos de dados, especifique os URIs nos parâmetros aplicáveis ao criar um job de ajuste supervisionado de modelo de texto.
Para usar o conjunto de dados de ajuste de amostra, especifique o local dele da seguinte maneira:
"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl",
Para usar o conjunto de dados de validação de amostra, especifique o local dele da seguinte maneira:
"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl",
A seguir
- Para começar a ajustar, consulte Ajustar modelos do Gemini usando o ajuste supervisionado de detalhes.
- Para saber como o ajuste supervisionado de detalhes pode ser usado em uma solução que cria uma base de conhecimento de IA generativa, consulte Solução de início rápido: base de conhecimento de IA generativa.