Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Réglage du texte

Cette page fournit les conditions préalables et des instructions détaillées pour affiner les modèles Gemini sur des données textuelles à l'aide de l'apprentissage supervisé.

Cas d'utilisation

Le réglage fin vous permet d'adapter les modèles Gemini de base à des tâches spécialisées. Voici quelques cas d'utilisation du texte :

Extraire des informations structurées à partir de discussions : transformez des conversations en plusieurs tours en données organisées en affinant un modèle pour identifier les attributs clés et les générer dans un format structuré comme JSONL.
Catégorisation de documents : affinez un modèle pour classer avec précision les documents longs dans des catégories prédéfinies, ce qui permet d'organiser et de récupérer efficacement les informations.
Suivi des instructions : améliorez la capacité d'un modèle à comprendre et à exécuter des instructions, ce qui permet d'accomplir les tâches de manière plus précise et fiable.
Revue de code automatisée : utilisez le fine-tuning pour créer un modèle capable de fournir des revues de code pertinentes, d'identifier les problèmes potentiels et de suggérer des améliorations.
Synthèse : générez des résumés concis et informatifs de longs textes en affinant un modèle pour capturer l'essence du contenu.
Génération de code et de DSL : affinez un modèle pour générer du code dans différents langages de programmation ou langages spécifiques à un domaine (DSL), ce qui permet d'automatiser les tâches de codage répétitives.
Amélioration des performances RAG : améliorez l'utilité et la justesse des systèmes de génération augmentée par récupération (RAG) en affinant le modèle de langage sous-jacent.

Format de l'ensemble de données

Le fileUri de votre ensemble de données peut être l'URI d'un fichier dans un bucket Cloud Storage, ou une URL HTTP ou HTTPS accessible au public.

Voici un exemple d'ensemble de données textuelles.

Pour voir l'exemple de format générique, consultez Exemple d'ensemble de données pour Gemini.

{
  "systemInstruction": {
    "role": "system",
    "parts": [
      {
        "text": "You are a pirate dog named Captain Barktholomew."
      }
    ]
  },
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hi"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "Argh! What brings ye to my ship?"
        }
      ]
    },
    {
      "role": "user",
      "parts": [
        {
          "text": "What's your name?"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
        }
      ]
    }
  ]
}

Exemples d'ensembles de données

Vous pouvez utiliser les exemples d'ensembles de données suivants pour apprendre à régler un modèle Gemini. Pour utiliser ces ensembles de données, spécifiez les URI dans les paramètres applicables lors de la création d'un job d'affinage supervisé d'un modèle de texte.

Pour utiliser l'exemple d'ensemble de données de réglage, spécifiez son emplacement comme suit :

"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl",

Pour utiliser l'exemple d'ensemble de données de validation, spécifiez son emplacement comme suit :

"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl",

Étapes suivantes

Pour commencer à régler vos modèles, consultez la section Régler des modèles Gemini à l'aide de l'affinage supervisé.
Pour savoir comment utiliser l'affinage supervisé dans une solution qui crée une base de connaissances d'IA générative, consultez Solution de démarrage rapide : base de connaissances d'IA générative.

Réglage du texte Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Cas d'utilisation

Format de l'ensemble de données

Exemples d'ensembles de données

Étapes suivantes

Réglage du texte