Ottimizzazione del testo

Questa pagina fornisce i prerequisiti e istruzioni dettagliate per il perfezionamento dei modelli Gemini sui dati di testo utilizzando l'apprendimento supervisionato.

Casi d'uso

Il fine-tuning ti consente di adattare i modelli Gemini di base per attività specializzate. Ecco alcuni casi d'uso del testo:

  • Estrazione di informazioni strutturate dalle chat: trasforma le conversazioni multiturno in dati organizzati mettendo a punto un modello per identificare gli attributi chiave e restituirli in un formato strutturato come JSONL.
  • Categorizzazione dei documenti: perfeziona un modello per classificare con precisione documenti lunghi in categorie predefinite, consentendo un'organizzazione e un recupero efficienti delle informazioni.
  • Aderenza alle istruzioni: migliora la capacità di un modello di comprendere ed eseguire le istruzioni, portando a un completamento più accurato e affidabile delle attività.
  • Revisione automatica del codice: utilizza l'ottimizzazione per creare un modello in grado di fornire revisioni del codice approfondite, identificare potenziali problemi e suggerire miglioramenti.
  • Riassunto: genera riassunti concisi e informativi di testi lunghi ottimizzando un modello per cogliere l'essenza dei contenuti.
  • Generazione di codice e DSL: perfeziona un modello per generare codice in vari linguaggi di programmazione o linguaggi specifici per il dominio (DSL), automatizzando le attività di codifica ripetitive.
  • Prestazioni RAG migliorate: migliora l'utilità e l'accuratezza dei sistemi Retrieval-Augmented Generation (RAG) perfezionando il modello linguistico sottostante.

Formato del set di dati

fileUri per il set di dati può essere l'URI di un file in un bucket Cloud Storage oppure un URL HTTP o HTTPS disponibile pubblicamente.

Di seguito è riportato un esempio di set di dati di testo.

Per visualizzare l'esempio di formato generico, vedi Esempio di set di dati per Gemini.

{
  "systemInstruction": {
    "role": "system",
    "parts": [
      {
        "text": "You are a pirate dog named Captain Barktholomew."
      }
    ]
  },
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hi"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "Argh! What brings ye to my ship?"
        }
      ]
    },
    {
      "role": "user",
      "parts": [
        {
          "text": "What's your name?"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
        }
      ]
    }
  ]
}

Set di dati di esempio

Puoi utilizzare i seguenti set di dati di esempio per scoprire come ottimizzare un modello Gemini. Per utilizzare questi set di dati, specifica gli URI nei parametri applicabili quando crei un job di fine-tuning supervisionato di un modello di testo.

Per utilizzare il set di dati di ottimizzazione di esempio, specifica la sua posizione nel seguente modo:

"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl",

Per utilizzare il set di dati di convalida di esempio, specifica la sua posizione nel seguente modo:

"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl",

Passaggi successivi