Ottimizzazione del testo

Questa pagina fornisce i prerequisiti e le istruzioni dettagliate per il fine-tuning dei modelli Gemini sui dati di testo utilizzando l'apprendimento supervisionato.

Casi d'uso

Il fine-tuning ti consente di adattare i modelli Gemini di base per attività specializzate. Di seguito sono riportati alcuni casi d'uso del testo:

  • Estrazione di informazioni strutturate dalle chat: trasforma le conversazioni multi-turn in dati organizzati eseguendo il fine-tuning di un modello per identificare gli attributi chiave e restituirli in un formato strutturato come JSONL.
  • Categorizzazione dei documenti: esegui il fine-tuning di un modello per classificare con precisione i documenti lunghi in categorie predefinite, consentendo un' organizzazione e un recupero efficienti delle informazioni.
  • Aderenza alle istruzioni: migliora la capacità di un modello di comprendere ed eseguire le istruzioni, portando a un completamento delle attività più accurato e affidabile.
  • Revisione automatica del codice: utilizza il fine-tuning per creare un modello in grado di fornire revisioni del codice approfondite, identificare potenziali problemi e suggerire miglioramenti.
  • Riassunto: genera riassunti concisi e informativi di testi lunghi eseguendo il fine-tuning di un modello per acquisire l'essenza dei contenuti.
  • Generazione di codice e DSL: esegui il fine-tuning di un modello per generare codice in vari linguaggi di programmazione o linguaggi specifici del dominio (DSL), automatizzando le attività di codifica ripetitive.
  • Miglioramento delle prestazioni di RAG: migliora l'utilità e l'accuratezza dei sistemi RAG (Retrieval-Augmented Generation) eseguendo il fine-tuning del modello linguistico sottostante.

Formato del set di dati

Il fileUri per il set di dati può essere l'URI di un file in un bucket Cloud Storage oppure un URL HTTP o HTTPS disponibile pubblicamente.

Di seguito è riportato un esempio di set di dati di testo.

Per visualizzare l'esempio di formato generico, consulta Esempio di set di dati per Gemini.

{
  "systemInstruction": {
    "role": "system",
    "parts": [
      {
        "text": "You are a pirate dog named Captain Barktholomew."
      }
    ]
  },
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hi"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "Argh! What brings ye to my ship?"
        }
      ]
    },
    {
      "role": "user",
      "parts": [
        {
          "text": "What's your name?"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
        }
      ]
    }
  ]
}

Set di dati di esempio

Puoi utilizzare i seguenti set di dati di esempio per scoprire come ottimizzare un modello Gemini. Per utilizzare questi set di dati, specifica gli URI nei parametri applicabili quando crei un job di fine-tuning supervisionato di un modello di testo.

Per utilizzare il set di dati di esempio per l'ottimizzazione, specifica la sua posizione come segue:

"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl",

Per utilizzare il set di dati di esempio per la convalida, specifica la sua posizione come segue:

"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl",

Passaggi successivi