checkpoint是模型在微調過程中,某個時間點的狀態快照。您可以在 Gemini 模型精修中使用中繼檢查點,執行下列操作:
- 儲存調整進度。
- 比較中繼檢查點的效能。
- 在過度擬合之前,請選取成效最佳的檢查點做為預設檢查點。
對於訓練週期少於 10 次的調整工作,系統會在每個訓練週期後大約儲存一個查核點。如果是調整工作,且有超過 10 個 epoch,系統會以平均分配的方式儲存約 10 個查核點,但最終查核點除外,因為系統會在所有 epoch 訓練完畢後立即儲存。
中繼查核點會在調整過程中依序部署至新端點。經過調整的模型端點代表預設查核點的端點,而經過調整的模型查核點則包含所有查核點及其對應的端點。
支援的模型
下列 Gemini 模型支援檢查點:
gemini-2.0-flash-001
gemini-2.0-flash-lite-001
如要進一步瞭解 Gemini 模型版本,請參閱「Google 模型」和「模型版本和生命週期」。
建立匯出檢查點的調整工作
您可以使用 Google Gen AI SDK 或 Google Cloud 主控台,建立可匯出檢查點的監督式精修工作。
主控台
如要建立可匯出檢查點的調整工作,請前往「Vertex AI Studio」頁面,然後選取「調整」分頁。詳情請參閱「調整模型」。
Google Gen AI SDK
列出調整工作查核點
您可以在Google Cloud 主控台中查看已完成的調校工作檢查點,也可以使用 Google Gen AI SDK 列出檢查點。
如果停用中間檢查點,系統只會顯示或傳回最終檢查點。
主控台
如要在 Google Cloud 控制台中找到經過微調的模型,請前往「Vertex AI Studio」頁面。
在「調整」分頁中找出您的模型,然後按一下「監控」。
系統會顯示模型的調整指標和檢查點。在每個指標圖表中,系統會以註解的形式顯示檢查點編號,如下所示:
- 每個 epoch 都會顯示步驟編號和 epoch 編號。
- 步驟編號是指儲存檢查點時的確切步驟。
- 紀元數字是檢查點所屬的預估紀元數字,但已完成的調整工作所含的最終檢查點則會顯示確切的紀元數字。
Google Gen AI SDK
查看模型詳細資料和檢查點
您可以在 Google Cloud 控制台中查看經過微調的模型,也可以使用 Google Gen AI SDK 取得模型詳細資料,包括端點和檢查點。
模型的 Endpoint
欄位會更新為以下內容:
- 這項資訊會根據預設查核點更新,並代表在調整期間,調整工作為更新的預設查核點建立的端點。
- 如果沒有模型,或調校工作無法取得模型,
Endpoint
值會為空白。 如果系統尚未部署預設檢查點 (因為調校仍在進行中,或因為部署失敗),則
Endpoint
值為空白。
主控台
您可以在線上預測的「端點」頁面中,查看 Vertex AI Model Registry 中的調整後模型。
在 Google Cloud 控制台的 Vertex AI 專區中,前往「Model Registry」頁面。
按一下模型名稱。
系統隨即顯示模型的預設版本。
按一下「版本詳細資料」分頁標籤,查看模型版本相關資訊。
請注意,「目標」為
Large model
、「模型類型」為Foundation
,而「來源」為Vertex AI Studio tuning
。點選「Deploy & test」分頁標籤,查看模型部署的端點。
按一下端點名稱,前往「Endpoint」頁面,查看部署至端點的檢查點清單。每個查核點都會顯示模型版本 ID 和查核點 ID。
您也可以在「Tuning Job Details」頁面中查看檢查點。如要查看這個頁面,請前往「Tuning」頁面,然後按一下其中一個調整工作。
Google Gen AI SDK
測試檢查點
您可以在 Vertex AI Model Registry 中查看檢查點清單,並測試每個檢查點。您也可以使用 Google Gen AI SDK 列出及測試檢查點。
主控台
如要在 Google Cloud 控制台中找到經過微調的模型,請前往「Vertex AI Studio」頁面。
在「調整」分頁中找出您的模型,然後按一下「監控」。
在「監控」窗格中的檢查點表格中,按一下所需檢查點旁的「測試」連結。
Google Gen AI SDK
選取新的預設查核點
您可以使用預設查核點,代表成效最佳的查核點。根據預設,預設查核點是調整工作中的最後一個查核點。
部署含有查核點的模型時,系統會部署預設查核點。
複製含有查核點的模型時,目的地模型的預設查核點 ID 會與來源模型相同。系統會複製所有查核點,因此您可以為目的地模型選取新的預設查核點。
如果您更新預設查核點,系統會更新調整工作端點,您可以使用新的端點進行預測。
主控台
如要在 Google Cloud 控制台中找到經過微調的模型,請前往「Vertex AI Studio」頁面。
在「調整」分頁中找出您的模型,然後按一下「監控」。
在「監控」窗格中的檢查點表格中,按一下所需檢查點旁的
「動作」,然後選取「設為預設」。按一下「確認」。
指標圖表和查核點表格會更新,顯示新的預設查核點。TuningJob 詳細資料頁面中的端點會更新為顯示新預設查核點的端點。
Google Gen AI SDK
後續步驟
- 進一步瞭解 Gemini 模型的監督式精細調整。