L'ottimizzazione continua ti consente di continuare a ottimizzare un modello o un checkpoint del modello già ottimizzato aggiungendo altre epoche o esempi di addestramento. L'utilizzo di un modello o un checkpoint già ottimizzato come modello di base consente di sperimentare l'ottimizzazione in modo più efficiente.
Puoi utilizzare l'ottimizzazione continua per i seguenti scopi:
- Ottimizzare con più dati se un modello ottimizzato esistente non è sufficiente.
- Migliorare le prestazioni o mantenere il modello aggiornato con i nuovi dati.
- Personalizzare ulteriormente un modello ottimizzato esistente.
I seguenti modelli Gemini supportano l'ottimizzazione continua:
Fai clic per espandere i modelli supportati
Per informazioni dettagliate sulle versioni dei modelli Gemini, consulta Modelli Google e Versioni e ciclo di vita dei modelli.
Configurare l'ottimizzazione continua
Quando crei un job di ottimizzazione continua, tieni presente quanto segue:
- L'ottimizzazione continua è supportata nell'SDK Google Gen AI. Non è supportata nell'SDK Agent Platform per Python.
Devi fornire un nome della risorsa modello:
- Nella Google Cloud console, il nome della risorsa modello viene visualizzato nella pagina Ottimizzazione di Gemini Enterprise Agent Platform, nel campo Dettagli ottimizzazione > Nome modello.
- Il nome della risorsa modello utilizza il seguente formato:
projects/{project}/locations/{location}/models/{modelId}@{version_id}{version_id}è facoltativo e può essere l'ID della versione generata o un alias della versione fornito dall'utente. Se viene omesso, viene utilizzata la versione predefinita.
Se non specifichi una versione del modello, viene utilizzata la versione predefinita.
Se utilizzi un checkpoint come modello di base e non specifichi un ID del checkpoint, viene utilizzato il checkpoint predefinito. Per saperne di più, consulta Utilizzare i checkpoint nel fine-tuning supervisionato per i modelli Gemini. Nella Google Cloud console, il checkpoint predefinito può essere trovato come segue:
- Vai alla pagina Model Registry.
- Fai clic sul Nome modello del modello.
- Fai clic su Visualizza tutte le versioni.
- Fai clic sulla versione che preferisci per visualizzare un elenco di checkpoint. Il checkpoint predefinito è indicato dalla parola
defaultaccanto all'ID del checkpoint.
Per impostazione predefinita, viene creata una nuova versione del modello nello stesso modello principale del modello pre-ottimizzato. Se fornisci un nuovo nome visualizzato del modello ottimizzato, viene creato un nuovo modello.
Solo i modelli di base di ottimizzazione supervisionata ottimizzati a partire dall'11 luglio 2025 possono essere utilizzati come modelli di base per l'ottimizzazione continua.
Se utilizzi le chiavi di crittografia gestite dal cliente (CMEK), il job di ottimizzazione continua deve utilizzare la stessa CMEK utilizzata nel job di ottimizzazione per il modello pre-ottimizzato.
Console
Per configurare l'ottimizzazione continua per un modello pre-ottimizzato utilizzando la Google Cloud console, segui questi passaggi:
Nella sezione Gemini Enterprise Agent Platform della Google Cloud console, vai alla pagina Agent Platform Studio.
Fai clic su Crea un modello ottimizzato.
In Dettagli modello, configura quanto segue:
- Scegli Ottimizza un modello pre-ottimizzato.
- Nel campo Modello pre-ottimizzato, scegli il nome del modello pre-ottimizzato.
- Se il modello ha almeno un checkpoint, viene visualizzato il campo a discesa Checkpoint. Scegli il checkpoint che preferisci.
Fai clic su Continua.
REST
Per configurare l'ottimizzazione continua, invia una richiesta POST utilizzando il
tuningJobs.create
metodo. Alcuni parametri non sono supportati da tutti i modelli. Assicurati di includere solo i parametri applicabili per il modello che stai ottimizzando.
Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:
- Parametri per l'ottimizzazione continua:
- TUNED_MODEL_NAME: nome del modello ottimizzato da utilizzare.
- CHECKPOINT_IDOptional: ID del checkpoint da utilizzare.
- I parametri rimanenti sono gli stessi dell' ottimizzazione supervisionata o dell' ottimizzazione delle preferenze.
Metodo HTTP e URL:
POST https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
Corpo JSON della richiesta:
{
"preTunedModel": {
"tunedModelName": "TUNED_MODEL_NAME",
"checkpointId": "CHECKPOINT_ID",
},
"supervisedTuningSpec" : {
"trainingDatasetUri": "TRAINING_DATASET_URI",
"validationDatasetUri": "VALIDATION_DATASET_URI",
"hyperParameters": {
"epochCount": EPOCH_COUNT,
"adapterSize": "ADAPTER_SIZE",
"learningRateMultiplier": "LEARNING_RATE_MULTIPLIER"
},
"exportLastCheckpointOnly": EXPORT_LAST_CHECKPOINT_ONLY,
"evaluationConfig": {
"metrics": [
{
"aggregation_metrics": ["AVERAGE", "STANDARD_DEVIATION"],
"METRIC_SPEC": {
"METRIC_SPEC_FIELD_NAME":
METRIC_SPEC_FIELD_CONTENT
}
},
],
"outputConfig": {
"gcs_destination": {
"output_uri_prefix": "CLOUD_STORAGE_BUCKET"
}
},
},
},
"tunedModelDisplayName": "TUNED_MODEL_DISPLAYNAME",
"encryptionSpec": {
"kmsKeyName": "KMS_KEY_NAME"
},
"serviceAccount": "SERVICE_ACCOUNT"
}
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json,
quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs"
PowerShell
Salva il corpo della richiesta in un file denominato request.json,
e quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs" | Select-Object -Expand Content
Dovresti ricevere una risposta JSON simile alla seguente.
Comando curl di esempio
PROJECT_ID=myproject
LOCATION=global
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/tuningJobs" \
-d \
$'{
"preTunedModel": "gemini-2.5-flash",
"supervisedTuningSpec" : {
"trainingDatasetUri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_train_data.jsonl",
"validationDatasetUri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_validation_data.jsonl"
},
"tunedModelDisplayName": "tuned_gemini"
}'
SDK Google Gen AI
L'esempio seguente mostra come configurare l'ottimizzazione continua utilizzando l'SDK Google Gen AI.