Um checkpoint é um snapshot do estado de um modelo em um ponto específico do processo de ajuste. É possível usar checkpoints intermediários em ajuste de modelos do Gemini para fazer o seguinte:
- Salvar o progresso do ajuste.
- Comparar a performance de checkpoints intermediários.
- Selecionar o checkpoint de melhor performance antes do overfitting para ser o checkpoint padrão.
Para jobs de ajuste com menos de 10 épocas, um checkpoint é salvo aproximadamente após cada época. Para jobs de ajuste com mais de 10 épocas, cerca de 10 checkpoints são salvos em distribuição uniforme, com exceção do checkpoint final, que é salvo imediatamente após o treinamento de todas as épocas.
Os checkpoints intermediários são implantados em novos endpoints sequencialmente à medida que o ajuste avança. O endpoint do modelo ajustado representa o endpoint do checkpoint padrão, e os checkpoints do modelo ajustado incluem todos os checkpoints e os endpoints correspondentes.
Modelos compatíveis
Os seguintes modelos do Gemini são compatíveis com checkpoints:
Para informações detalhadas sobre as versões do modelo do Gemini, consulte Modelos do Google e Versões e ciclo de vida do modelo.
Criar um job de ajuste que exporta checkpoints
É possível criar um job de ajuste que exporta checkpoints usando o SDK do Google Gen AI ou o Google Cloud console.
Console
Para criar um job de ajuste que exporta checkpoints, acesse a Vertex AI Studio página e selecione a guia Ajuste. Para mais informações, consulte Ajustar um modelo.
SDK do Google Gen AI
(Visualização) É possível configurar o serviço de avaliação de IA generativa para executar avaliações automaticamente após cada checkpoint. Essa configuração de avaliação está disponível na região us-central1.
Instale o SDK do Google Gen AI:
pip install --upgrade google-genai
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK do Gen AI com a Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_VERTEXAI=True
Crie o job de ajuste:
Listar os checkpoints de um job de ajuste
É possível conferir os checkpoints do job de ajuste concluído no Google Cloud console ou listá-los usando o SDK do Google Gen AI.
Se os checkpoints intermediários estiverem desativados, apenas o checkpoint final será mostrado ou retornado.
Console
Para localizar o modelo ajustado no Google Cloud console, acesse a página Vertex AI Studio.
Na guia Ajuste, encontre seu modelo e clique em Monitorar.
As métricas de ajuste e os checkpoints do modelo são mostrados. Em cada gráfico de métricas, os números de checkpoint são mostrados como anotações da seguinte maneira:
- Para cada época, você verá um número de etapa e um número de época.
- O número da etapa é a etapa exata em que um checkpoint é salvo.
- O número da época é um número estimado da época a que o checkpoint pertence, exceto para o checkpoint final de um job de ajuste concluído, que tem o número exato da época.
SDK do Google Gen AI
Conferir detalhes e checkpoints do modelo
É possível conferir o modelo ajustado no Google Cloud console ou usar o SDK do Google Gen AI para receber detalhes do modelo, incluindo endpoints e checkpoints.
O campo Endpoint do modelo é atualizado da seguinte maneira:
- Ele é atualizado com base no checkpoint padrão e representa o endpoint que o job de ajuste criou para o checkpoint padrão atualizado durante o ajuste.
- Se um modelo não estiver presente ou se o job de ajuste não conseguir um modelo, o
Endpointvalor estará vazio. Se o checkpoint padrão não for implantado (porque o ajuste ainda está em andamento ou porque a implantação falhou), o valor
Endpointestará vazio.
Console
É possível conferir o modelo ajustado no Registro de modelos da Vertex AI na página Endpoints de previsão on-line.
Acesse a página Registro do modelo na seção "Vertex AI" do Google Cloud console.
Clique no nome do modelo.
A versão padrão do modelo aparece.
Clique na guia Detalhes da versão para conferir informações sobre a versão do modelo.
O objetivo é
Large model, o tipo de modelo éFoundatione a origem éVertex AI Studio tuning.Clique na guia Implantar e testar para conferir o endpoint em que o modelo está implantado.
Clique no nome do endpoint para acessar a página Endpoint e conferir a lista de checkpoints implantados no endpoint. Para cada checkpoint, o ID da versão do modelo e o ID do checkpoint são mostrados. O checkpoint padrão é indicado pela palavra
defaultao lado do ID do checkpoint.
Como alternativa, os checkpoints também podem ser conferidos na página Detalhes do job de ajuste. Para acessar essa página, acesse a página Ajuste e clique em um dos jobs de ajuste.
SDK do Google Gen AI
Se você configurou o serviço de avaliação de IA generativa para executar avaliações após cada checkpoint, confira o bucket do Cloud Storage configurado para resultados de avaliação.
Testar os checkpoints
É possível conferir uma lista de checkpoints no Registro de modelos da Vertex AI e testar cada um deles. Ou você pode usar o SDK do Google Gen AI para listar e testar seus checkpoints.
Console
Para localizar o modelo ajustado no Google Cloud console, acesse a página Vertex AI Studio.
Na guia Ajuste, encontre seu modelo e clique em Monitorar.
Na tabela de checkpoints no painel Monitorar, ao lado do checkpoint desejado, clique no link Testar.
SDK do Google Gen AI
Selecionar um novo checkpoint padrão
É possível usar o checkpoint padrão para representar o checkpoint de melhor performance. Por padrão, o checkpoint padrão é o checkpoint final de um job de ajuste.
Ao implantar um modelo com checkpoints, o checkpoint padrão é implantado.
Ao copiar um modelo com checkpoints, o modelo de destino terá o mesmo ID de checkpoint padrão que o modelo de origem. Todos os checkpoints são copiados, então você pode selecionar um novo checkpoint padrão para o modelo de destino.
O endpoint do job de ajuste será atualizado se você atualizar um checkpoint padrão, e será possível usar o novo endpoint para inferência.
Console
Para localizar o modelo ajustado no Google Cloud console, acesse a página Vertex AI Studio.
Na guia Ajuste, encontre seu modelo e clique em Monitorar.
Na tabela de checkpoints no painel Monitorar, ao lado do checkpoint desejado, clique em Ações e selecione Definir como padrão.
Clique em Confirmar.
Os gráficos de métricas e a tabela de checkpoints são atualizados para mostrar o novo checkpoint padrão. O endpoint na página de detalhes do TuningJob é atualizado para mostrar o endpoint do novo checkpoint padrão.
SDK do Google Gen AI
A seguir
- Saiba mais sobre o ajuste supervisionado de modelos do Gemini.
- Saiba mais sobre o ajuste de preferências para modelos do Gemini.