Le réglage des préférences Vertex AI vous permet de régler vos modèles Gemini avec des données de commentaires humains.
Le réglage des préférences permet au modèle d'apprendre à partir des préférences subjectives des utilisateurs, qui sont difficiles à définir à l'aide de libellés spécifiques ou par le biais d'un réglage fin supervisé seul.
L'ensemble de données d'entrée pour le réglage des préférences contient des exemples composés d'une requête et d'une paire de réponses indiquant celle qui est préférée et celle qui ne l'est pas. Le modèle apprend à générer des réponses préférées avec une probabilité plus élevée et des réponses non préférées avec une probabilité plus faible.
Pour savoir comment préparer l'ensemble de données, consultez Préparer les données de réglage des préférences pour les modèles Gemini.
Modèles compatibles
Les modèles Gemini suivants sont compatibles avec le réglage des préférences :
Limites
| Spécification | Valeur |
|---|---|
| Modalités | Texte |
| Taille du fichier de l'ensemble de données d'entraînement | 1 Go |
| Nombre maximal de jetons d'entrée et de sortie par exemple d'entraînement | 131 072 |
| Nombre maximal de jetons d'entrée et de sortie pour le service | Identique au modèle Gemini de base |
| Nombre maximal d'exemples d'entraînement dans un ensemble de données d'entraînement | 10 millions d'exemples d'entraînement en texte brut |
| Taille maximale de l'ensemble de données de validation | 5 000 exemples ou 30 % du nombre d'exemples d'entraînement s'il y a plus de 1 000 exemples de validation |
| Taille de l'adaptateur | Les valeurs acceptées sont 1, 2, 4, 8 et 16. |
Bonnes pratiques
Avant d'appliquer l'algorithme d'optimisation des préférences à votre modèle, nous vous recommandons vivement de procéder comme suit :
- Ajustez le modèle à l'aide de l'affinage supervisé sur les données de réponse préférées. Cela apprend au modèle à générer des réponses préférées lors de l'inférence.
- Continuez l'ajustement à partir du point de contrôle produit à l'étape 1 à l'aide de l'ajustement des préférences. Cela apprend au modèle à augmenter l'écart de probabilité entre les réponses préférées et celles qui ne le sont pas.
Pour créer l'ensemble de données pour le réglage supervisé, utilisez les paires de requêtes et de réponses acceptées dans votre ensemble de données de préférences comme requête et cible pour votre ensemble de données pour le réglage supervisé. En règle générale, une ou deux époques de réglage fin supervisé devraient suffire, bien que cela puisse varier en fonction de la taille de l'ensemble de données et de la façon dont votre ensemble de données d'entraînement est initialement aligné sur le modèle Gemini.
Pour utiliser le réglage supervisé afin de régler le modèle, suivez les étapes décrites dans Régler des modèles Gemini à l'aide du réglage supervisé.
Quota
Le quota est appliqué au nombre de jobs de réglage simultanés. Chaque projet est associé à un quota par défaut pour exécuter au moins un job de réglage. Il s'agit d'un quota mondial, partagé entre toutes les régions disponibles et tous les modèles compatibles. Si vous souhaitez exécuter plus de jobs simultanément, vous devez demander un quota supplémentaire pour Global concurrent tuning jobs.
Tarifs
Pour connaître les tarifs du réglage des préférences Gemini, consultez Tarifs Vertex AI.
À des fins de tarification, le nombre de jetons pour chaque exemple de réglage est calculé en multipliant le nombre de jetons dans l'invite par deux, puis en ajoutant le nombre de jetons de complément.
Étapes suivantes
- Préparez un ensemble de données pour le réglage des préférences.
- Découvrez comment déployer un modèle Gemini réglé.