Le réglage continu vous permet de continuer à régler un modèle ou un point de contrôle de modèle déjà réglé en ajoutant des époques ou des exemples d'entraînement. L'utilisation d'un modèle ou d'un point de contrôle déjà ajusté comme modèle de base permet d'effectuer des tests d'ajustement plus efficaces.
Vous pouvez utiliser l'ajustement continu pour les raisons suivantes :
- Pour ajuster un modèle déjà ajusté avec plus de données s'il est sous-ajusté.
- Pour améliorer les performances ou maintenir le modèle à jour avec de nouvelles données.
- Pour personnaliser davantage un modèle réglé existant.
Les modèles Gemini suivants sont compatibles avec le réglage continu :
Pour en savoir plus sur les versions des modèles Gemini, consultez Modèles Google et Versions et cycle de vie des modèles.
Configurer l'optimisation continue
Lorsque vous créez une tâche d'ajustement continu, tenez compte des points suivants :
- Le réglage continu est compatible avec le SDK Google Gen AI. Il n'est pas compatible avec le SDK Vertex AI pour Python.
Vous devez indiquer un nom de ressource de modèle :
- Dans la console Google Cloud , le nom de ressource du modèle s'affiche sur la page Vertex AI Tuning, dans le champ Détails du réglage > Nom du modèle.
- Le nom de ressource du modèle utilise le format suivant :
projects/{project}/locations/{location}/models/{modelId}@{version_id}{version_id}est facultatif et peut être l'ID de version généré ou un alias de version fourni par l'utilisateur. Si elle est omise, la version par défaut est utilisée.
Si vous ne spécifiez pas de version de modèle, la version par défaut est utilisée.
Si vous utilisez un point de contrôle comme modèle de base et que vous ne spécifiez pas d'ID de point de contrôle, le point de contrôle par défaut est utilisé. Pour en savoir plus, consultez Utiliser des points de contrôle dans l'affinage supervisé pour les modèles Gemini. Dans la console Google Cloud , le point de contrôle par défaut se trouve comme suit :
- Accédez à la page "Registre de modèles".
- Cliquez sur le nom du modèle.
- Cliquez sur Afficher toutes les versions.
- Cliquez sur la version souhaitée pour afficher la liste des points de contrôle. Le point de contrôle par défaut est indiqué par le mot
defaultà côté de son ID.
Par défaut, une nouvelle version du modèle est créée sous le même modèle parent que le modèle pré-entraîné. Si vous indiquez un nouveau nom à afficher pour le modèle ajusté, un nouveau modèle est créé.
Seuls les modèles de base de réglage supervisé qui sont réglés à partir du 11 juillet 2025 peuvent être utilisés comme modèles de base pour le réglage continu.
Si vous utilisez des clés de chiffrement gérées par le client (CMEK), votre job d'ajustement continu doit utiliser la même clé CMEK que celle utilisée dans le job d'ajustement pour le modèle pré-ajusté.
Console
Pour configurer le réglage continu d'un modèle préréglé à l'aide de la consoleGoogle Cloud , procédez comme suit :
Dans la section "Vertex AI" de la console Google Cloud , accédez à la page Vertex AI Studio.
Cliquez sur Créer un modèle réglé.
Sous Informations sur le modèle, configurez les éléments suivants :
- Choisissez Régler un modèle pré-réglé.
- Dans le champ Modèle pré-entraîné, choisissez le nom de votre modèle pré-entraîné.
- Si le modèle comporte au moins un point de contrôle, le champ déroulant Point de contrôle s'affiche. Choisissez le point de contrôle souhaité.
Cliquez sur Continuer.
REST
Pour configurer le réglage continu, envoyez une requête POST à l'aide de la méthode tuningJobs.create. Certains paramètres ne sont pas compatibles avec tous les modèles. Veillez à n'inclure que les paramètres applicables au modèle que vous réglez.
Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- Paramètres pour l'optimisation continue :
- TUNED_MODEL_NAME : nom du modèle réglé à utiliser.
- CHECKPOINT_ID(Facultatif) ID du point de contrôle à utiliser.
- Les autres paramètres sont les mêmes que pour l'affinage supervisé ou l'affinage des préférences.
Méthode HTTP et URL :
POST https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
Corps JSON de la requête :
{
"preTunedModel": {
"tunedModelName": "TUNED_MODEL_NAME",
"checkpointId": "CHECKPOINT_ID",
},
"supervisedTuningSpec" : {
"trainingDatasetUri": "TRAINING_DATASET_URI",
"validationDatasetUri": "VALIDATION_DATASET_URI",
"hyperParameters": {
"epochCount": EPOCH_COUNT,
"adapterSize": "ADAPTER_SIZE",
"learningRateMultiplier": "LEARNING_RATE_MULTIPLIER"
},
"exportLastCheckpointOnly": EXPORT_LAST_CHECKPOINT_ONLY,
"evaluationConfig": {
"metrics": [
{
"aggregation_metrics": ["AVERAGE", "STANDARD_DEVIATION"],
"METRIC_SPEC": {
"METRIC_SPEC_FIELD_NAME":
METRIC_SPEC_FIELD_CONTENT
}
},
],
"outputConfig": {
"gcs_destination": {
"output_uri_prefix": "CLOUD_STORAGE_BUCKET"
}
},
},
},
"tunedModelDisplayName": "TUNED_MODEL_DISPLAYNAME",
"encryptionSpec": {
"kmsKeyName": "KMS_KEY_NAME"
},
"serviceAccount": "SERVICE_ACCOUNT"
}
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON semblable à la suivante.
Exemple de commande curl
PROJECT_ID=myproject
LOCATION=global
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/tuningJobs" \
-d \
$'{
"preTunedModel": "gemini-2.5-flash",
"supervisedTuningSpec" : {
"trainingDatasetUri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_train_data.jsonl",
"validationDatasetUri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_validation_data.jsonl"
},
"tunedModelDisplayName": "tuned_gemini"
}'
SDK Google Gen AI
L'exemple suivant montre comment configurer l'ajustement continu à l'aide du SDK Google Gen AI.