查核點是模型在微調過程中,某個時間點的狀態快照。您可以在 Gemini 模型微調中使用中繼檢查點,執行下列操作:
- 儲存微調進度。
- 比較中繼檢查點的效能。
- 請先選取最佳檢查點,再將其設為預設檢查點,避免過度訓練。
如果微調工作少於 10 個訓練週期,系統大約會在每個訓練週期後儲存一個檢查點。如果微調工作超過 10 個訓練週期,系統會平均儲存約 10 個檢查點,但最後一個檢查點除外,因為系統會在所有訓練週期完成後立即儲存。
中繼檢查點會依序部署至新端點,隨著微調作業進行。微調模型端點代表預設檢查點的端點,微調模型檢查點則包含所有檢查點和對應的端點。
支援的模型
下列 Gemini 模型支援檢查點:
按一下即可展開支援的機型
如要進一步瞭解 Gemini 模型版本,請參閱「Google 模型」和「模型版本和生命週期」。
建立會匯出檢查點的微調工作
您可以使用 Google Gen AI SDK 或 Google Cloud 控制台,建立會匯出檢查點的微調工作。
控制台
如要建立會匯出檢查點的微調工作,請前往 Agent Platform Studio 頁面,然後選取「微調」分頁標籤。詳情請參閱「調整模型」。
Google Gen AI SDK
(搶先版) 您可以設定 Gen AI Evaluation Service,在每個檢查點後自動執行評估。這項評估設定適用於 us-central1 區域。
安裝 Google Gen AI SDK:
pip install --upgrade google-genai
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Gemini Enterprise Agent Platform 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_ENTERPRISE=True
建立微調工作:
列出調整工作的檢查點
您可以在Google Cloud 控制台中查看已完成微調作業的檢查點,也可以使用 Google Gen AI SDK 列出檢查點。
如果停用中繼檢查點,系統只會顯示或傳回最終檢查點。
控制台
如要在 Google Cloud 控制台中找到微調模型,請前往「Agent Platform Studio」頁面。
在「微調」分頁中找到模型,然後點選「監控」。
系統會顯示模型的微調指標和檢查點。在每個指標圖表中,檢查點編號會顯示為註解,如下所示:
- 每個訓練週期都會顯示步驟編號和訓練週期編號。
- 步數是儲存檢查點時的確切步數。
- 訓練週期數是檢查點所屬的預估訓練週期數,但已完成調整作業的最終檢查點除外,因為這類檢查點的訓練週期數是確切值。
Google Gen AI SDK
查看模型詳細資料和檢查點
您可以在 Google Cloud 控制台中查看微調模型,也可以使用 Google Gen AI SDK 取得模型詳細資料,包括端點和檢查點。
模型的 Endpoint 欄位會更新如下:
- 系統會根據預設查核點更新這項資訊,並代表微調作業為更新後的預設查核點建立的端點。
- 如果沒有模型,或微調工作無法取得模型,
Endpoint值會是空白。 如果預設檢查點尚未部署 (因為微調仍在進行中,或部署失敗),
Endpoint值會是空白。
控制台
您可以在「線上預測」端點頁面中,查看 Gemini Enterprise Agent Platform Model Registry 內調整後的模型。
前往 Google Cloud 控制台的「Agent Platform」部分,然後前往「Model Registry」頁面。
按一下模型名稱。
系統會顯示模型的預設版本。
按一下「版本詳細資料」分頁標籤,查看模型版本相關資訊。
請注意,「目標」為
Large model、「模型類型」為Foundation、「來源」為Vertex AI Studio tuning。按一下「Deploy & test」(部署及測試) 分頁標籤,即可查看模型部署的端點。
按一下端點名稱前往「端點」頁面,查看部署至端點的檢查點清單。每個檢查點都會顯示模型版本 ID 和檢查點 ID。預設檢查點會以檢查點 ID 旁的
default表示。
或者,您也可以在「調整工作詳細資料」頁面中查看檢查點。如要查看這個頁面,請前往「調整」頁面,然後按一下其中一項調整工作。
Google Gen AI SDK
如果您已設定 Gen AI Evaluation Service,在每個檢查點後執行評估,請查看您為評估結果設定的 Cloud Storage bucket。
測試查核點
您可以在 Gemini Enterprise Agent Platform Model Registry 中查看檢查點清單,並測試每個檢查點。或者,您也可以使用 Google Gen AI SDK 列出及測試檢查點。
控制台
如要在 Google Cloud 控制台中找到微調模型,請前往「Agent Platform Studio」頁面。
在「微調」分頁中找到模型,然後點選「監控」。
在「監控」窗格的檢查點表格中,點按所需檢查點旁的「測試」連結。
Google Gen AI SDK
選取新的預設查核點
您可以使用預設檢查點,代表成效最佳的檢查點。 根據預設,預設查核點是微調工作的最終查核點。
部署含有檢查點的模型時,系統會部署預設檢查點。
複製含有檢查點的模型時,目的地模型會與來源模型具有相同的預設檢查點 ID。系統會複製所有查核點,因此您可以為目標模型選取新的預設查核點。
更新預設檢查點後,微調工作端點也會隨之更新,您可以使用新端點進行推論。
控制台
如要在 Google Cloud 控制台中找到微調模型,請前往「Agent Platform Studio」頁面。
在「微調」分頁中找到模型,然後點選「監控」。
在「監控」窗格的檢查點表格中,按一下所需檢查點旁的「動作」,然後選取「設為預設」。
按一下「確認」。
指標圖表和檢查點表格會更新,顯示新的預設檢查點。系統會更新 TuningJob 詳細資料頁面中的端點,顯示新預設查核點的端點。
Google Gen AI SDK
後續步驟
- 進一步瞭解 Gemini 模型監督式微調。
- 進一步瞭解如何調整 Gemini 模型的偏好設定。