關於 Gemini 模型的偏好調整

Vertex AI 偏好設定調整功能可讓您使用使用者意見回饋資料，調整 Gemini 模型。

偏好設定調整功能可讓模型從主觀使用者偏好設定中學習，這些偏好設定難以使用特定標籤定義，也無法單靠監督式微調來定義。

偏好調整輸入資料集包含提示和一組回應的範例，指出偏好哪個回應，以及不偏好哪個回應。模型會學習生成機率較高的偏好回覆，以及機率較低的非偏好回覆。

支援的模型

下列 Gemini 模型支援偏好設定調整功能：

將偏好最佳化演算法套用至模型前，強烈建議您採取下列行動：

如要建立監督式微調資料集，請使用偏好資料集中的提示和接受的回覆配對，做為監督式微調資料集的提示和目標。通常一到兩個訓練週期就足夠，但這會因資料集大小，以及訓練資料集與 Gemini 模型初始狀態的相符程度而異。

如要使用監督式微調功能調整模型，請按照「使用監督式微調功能調整 Gemini 模型」一文中的步驟操作。

系統會對並行微調工作數量強制執行配額。每個專案都設有預設配額，至少可執行一項微調作業。這是全域配額，適用於所有可用區域和支援的模型。如要同時執行更多工作，請申請更多配額給 Global concurrent tuning jobs。

如要瞭解 Gemini 偏好設定調整功能的定價，請參閱 Vertex AI 定價。

計算費用時，每個微調範例的權杖數量計算方式如下：提示中的權杖數量乘以 2，然後加上完成權杖數量。