Un checkpoint è uno snapshot dello stato di un modello in un punto specifico del processo di ottimizzazione. Puoi utilizzare i checkpoint intermedi nell'ottimizzazione dei modelli Gemini per:
- Salvare lo stato di avanzamento dell'ottimizzazione.
- Confrontare il rendimento dei checkpoint intermedi.
- Selezionare il checkpoint con il rendimento migliore prima dell'overfitting come checkpoint predefinito.
Per i job di ottimizzazione con meno di 10 epoche, viene salvato un checkpoint circa dopo ogni epoca. Per i job di ottimizzazione con più di 10 epoche, vengono salvati circa 10 checkpoint con una distribuzione uniforme, ad eccezione del checkpoint finale, che viene salvato immediatamente dopo l'addestramento di tutte le epoche.
I checkpoint intermedi vengono sottoposti a deployment in nuovi endpoint in sequenza man mano che l'ottimizzazione procede. L'endpoint del modello ottimizzato rappresenta l'endpoint del checkpoint predefinito, mentre i checkpoint del modello ottimizzato includono tutti i checkpoint e i relativi endpoint.
Modelli supportati
I seguenti modelli Gemini supportano i checkpoint:
Per informazioni dettagliate sulle versioni dei modelli Gemini, consulta Modelli Google e Versioni e ciclo di vita dei modelli.
Creare un job di ottimizzazione che esporti i checkpoint
Puoi creare un job di ottimizzazione che esporti i checkpoint utilizzando l'SDK Google Gen AI o la Google Cloud console.
Console
Per creare un job di ottimizzazione che esporti i checkpoint, vai alla pagina Vertex AI Studio e seleziona la scheda Ottimizzazione. Per ulteriori informazioni, consulta Ottimizzare un modello.
SDK Google Gen AI
(Anteprima) Puoi configurare il Gen AI evaluation service per eseguire le valutazioni automaticamente dopo ogni checkpoint. Questa configurazione di valutazione è disponibile nella regione us-central1.
Installa l'SDK Google Gen AI:
pip install --upgrade google-genai
Per saperne di più, consulta la documentazione di riferimento dell'SDK.
Imposta le variabili di ambiente per utilizzare l'SDK Gen AI con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_VERTEXAI=True
Crea il job di ottimizzazione:
Elencare i checkpoint per un job di ottimizzazione
Puoi visualizzare i checkpoint per il job di ottimizzazione completato nella Google Cloud console o elencarli utilizzando l'SDK Google Gen AI.
Se i checkpoint intermedi sono disattivati, viene visualizzato o restituito solo il checkpoint finale.
Console
Per individuare il modello ottimizzato nella Google Cloud console, vai alla pagina Vertex AI Studio.
Nella scheda Ottimizzazione, trova il modello e fai clic su Monitora.
Vengono visualizzate le metriche di ottimizzazione e i checkpoint del modello. In ogni grafico delle metriche, i numeri dei checkpoint vengono visualizzati come annotazioni nel seguente modo:
- Per ogni epoca, viene visualizzato un numero di passaggi e un numero di epoca.
- Il numero di passaggi è il passaggio esatto in cui viene salvato un checkpoint.
- Il numero di epoca è un numero di epoca stimato a cui appartiene il checkpoint, ad eccezione del checkpoint finale per un job di ottimizzazione completato, che ha il numero di epoca esatto.
SDK Google Gen AI
Visualizzare i dettagli e i checkpoint del modello
Puoi visualizzare il modello ottimizzato nella Google Cloud console o utilizzare l' SDK Google Gen AI per ottenere i dettagli del modello, inclusi endpoint e checkpoint.
Il campo Endpoint del modello viene aggiornato nel seguente modo:
- Viene aggiornato in base al checkpoint predefinito e rappresenta l'endpoint creato dal job di ottimizzazione per il checkpoint predefinito aggiornato durante l'ottimizzazione.
- Se un modello non è presente o se il job di ottimizzazione non riesce a recuperare un modello, il valore
Endpointè vuoto. Se il checkpoint predefinito non viene sottoposto a deployment (perché l'ottimizzazione è ancora in corso o perché il deployment non è riuscito), il valore
Endpointè vuoto.
Console
Puoi visualizzare il modello ottimizzato in Vertex AI Model Registry nella pagina Endpoint di Previsione online.
Vai alla pagina Model Registry dalla sezione Vertex AI nella Google Cloud console.
Fai clic sul nome del modello.
Viene visualizzata la versione predefinita del modello.
Fai clic sulla scheda Dettagli versione per visualizzare le informazioni sulla versione del modello.
Tieni presente che l'obiettivo è
Large model, il tipo di modello èFoundatione l'origine èVertex AI Studio tuning.Fai clic sulla scheda Esegui il deployment e testa per visualizzare l'endpoint in cui è stato eseguito il deployment del modello.
Fai clic sul nome dell'endpoint per andare alla pagina Endpoint e visualizzare l'elenco dei checkpoint di cui è stato eseguito il deployment nell'endpoint. Per ogni checkpoint vengono visualizzati l'ID della versione del modello e l'ID del checkpoint. Il checkpoint predefinito è indicato dalla parola
defaultaccanto all'ID del checkpoint.
In alternativa, i checkpoint possono essere visualizzati anche nella pagina Dettagli job di ottimizzazione. Per visualizzare questa pagina, vai alla pagina Ottimizzazione e fai clic su uno dei job di ottimizzazione.
SDK Google Gen AI
Se hai configurato il Gen AI evaluation service per eseguire le valutazioni dopo ogni checkpoint, visualizza il bucket Cloud Storage configurato per i risultati della valutazione.
Testare i checkpoint
Puoi visualizzare un elenco di checkpoint in Vertex AI Model Registry e testarli singolarmente. In alternativa, puoi utilizzare l'SDK Google Gen AI per elencare e testare i checkpoint.
Console
Per individuare il modello ottimizzato nella Google Cloud console, vai alla pagina Vertex AI Studio.
Nella scheda Ottimizzazione, trova il modello e fai clic su Monitora.
Nella tabella dei checkpoint nel riquadro Monitora , fai clic sul link Testa accanto al checkpoint desiderato.
SDK Google Gen AI
Selezionare un nuovo checkpoint predefinito
Puoi utilizzare il checkpoint predefinito per rappresentare il checkpoint con il rendimento migliore. Per impostazione predefinita, il checkpoint predefinito è il checkpoint finale di un job di ottimizzazione.
Quando esegui il deployment di un modello con checkpoint, viene eseguito il deployment del checkpoint predefinito.
Quando copi un modello con checkpoint, il modello di destinazione avrà lo stesso ID del checkpoint predefinito del modello di origine. Vengono copiati tutti i checkpoint, quindi puoi selezionare un nuovo checkpoint predefinito per il modello di destinazione.
L'endpoint del job di ottimizzazione verrà aggiornato se aggiorni un checkpoint predefinito e potrai utilizzare il nuovo endpoint per l'inferenza.
Console
Per individuare il modello ottimizzato nella Google Cloud console, vai alla pagina Vertex AI Studio.
Nella scheda Ottimizzazione, trova il modello e fai clic su Monitora.
Nella tabella dei checkpoint nel riquadro Monitora , fai clic su Azioni accanto al checkpoint desiderato e seleziona Imposta come predefinito.
Fai clic su Conferma.
I grafici delle metriche e la tabella dei checkpoint vengono aggiornati per mostrare il nuovo checkpoint predefinito. L'endpoint nella pagina dei dettagli di TuningJob viene aggiornato per mostrare l'endpoint del nuovo checkpoint predefinito.
SDK Google Gen AI
Passaggi successivi
- Scopri di più sul fine-tuning supervisionato per i modelli Gemini.
- Scopri di più sull' ottimizzazione delle preferenze per i modelli Gemini.