プリファレンスチューニングを使用して Gemini モデルをチューニングする

このドキュメントでは、Gemini モデルでプリファレンスチューニングを行う方法について説明します。

始める前に

始める前に、Gemini モデルのプリファレンスチューニングデータを準備するの手順に沿ってデータセットを準備する必要があります。

調整ジョブを作成する

コンソール

Google Cloud コンソールを使用してプリファレンスチューニングを構成するには、次の操作を行います。

Google Cloud コンソールの [Vertex AI] セクションで、[Vertex AI Studio] ページに移動します。

[Vertex AI Studio] に移動
[チューニング済みモデルを作成] をクリックします。
[プリファレンスチューニング] を選択します。
[モデルの詳細] で、次のように構成します。
1. [チューニング済みモデル名] フィールドに、新しいチューニング済みモデルの名前を入力します（最大 128 文字）。
2. [ベースモデル] フィールドで、チューニングする基盤モデルを選択します。
3. [リージョン] プルダウンフィールドで、パイプラインチューニングジョブが実行されるリージョンと、チューニングされたモデルがデプロイされるリージョンを選択します。
[チューニング設定] で、次のように構成します。
1. [エポック数] フィールドに、モデルのチューニングで実行するステップ数を入力します。
2. [アダプタサイズ] フィールドに、モデルのチューニングに使用するアダプタサイズを入力します。
3. 省略可: [ベータ] フィールドに、必要なベータ値を入力します。ベータは、チューニングされたモデルがベースラインにどの程度適合するかを制御する係数です。
4. [学習率の乗数] フィールドに、各イテレーションのステップサイズを入力します。デフォルト値は 1 です。
省略可: 中間チェックポイントを無効にして最新のチェックポイントのみを使用するには、[最後のチェックポイントのみをエクスポート] 切り替えボタンをクリックします。
[続行] をクリックします。

[チューニング用データセット] ページが開きます。
データセットファイルをアップロードするには、次のいずれかを選択します。
1. まだデータセットをアップロードしていない場合は、[ファイルを Cloud Storage にアップロード] のラジオボタンを選択します。
2. [JSONL ファイルの選択] フィールドで [参照] をクリックし、データセットファイルを選択します。
3. [データセットの場所] で [参照] をクリックし、データセットファイルを保存する Cloud Storage バケットを選択します。
4. データセットファイルがすでに Cloud Storage バケットにある場合は、[Cloud Storage 上の既存ファイル] のラジオボタンを選択します。
5. [Cloud Storage のファイルパス] フィールドで [参照] をクリックし、データセットファイルがある Cloud Storage バケットを選択します。
（省略可）トレーニング中に検証指標を取得するには、[モデル検証を有効にする] 切り替えボタンをクリックします。
1. [検証データセット] に、検証データセットの Cloud Storage パスを入力します。
[チューニングを開始] をクリックします。

新しいモデルは、[チューニングと抽出] ページの [マネージドチューニング] セクションに表示されます。モデルのチューニングが完了すると、[ステータス] に「成功」と表示されます。

REST

モデルのチューニングジョブを作成するには、tuningJobs.create メソッドを使用して POST リクエストを送信します。一部のパラメータは、すべてのモデルでサポートされているわけではありません。チューニングするモデルに適用可能なパラメータのみを含めるようにしてください。

リクエストのデータを使用する前に、次のように置き換えます。

PROJECT_ID: 実際のプロジェクト ID。
TUNING_JOB_REGION: チューニングジョブを実行するリージョン。これは、チューニング済みのモデルをアップロードするデフォルトのリージョンでもあります。
BASE_MODEL: チューニングする基盤モデルの名前。
TRAINING_DATASET_URI: トレーニングデータセットの Cloud Storage URI。データセットは JSONL ファイル形式でなければなりません。最適な結果を得るには、少なくとも 100～500 個のサンプルを含めます。詳細については、教師ありチューニングデータセットについてをご覧ください。
VALIDATION_DATASET_URI: 省略可。検証データセットファイルの Cloud Storage URI。
EPOCH_COUNT: 省略可。トレーニング中にモデルがトレーニングデータセット全体に対して行った完全なパスの数。事前入力された推奨値を使用する場合は、未設定のままにします。
BETA省略可: チューニングされたモデルがベースラインにどの程度適合するかを制御する係数。
ADAPTER_SIZE省略可: チューニングジョブに使用するアダプタのサイズ。チューニングジョブのアダプタのサイズは、トレーニング可能なパラメータの数に影響します。アダプタサイズが大きいほど、モデルはより複雑なタスクを学習できますが、より大きなトレーニングデータセットと長いトレーニング時間が必要になります。
LEARNING_RATE_MULTIPLIER: 省略可。推奨学習率に適用する乗数。推奨値を使用する場合は、未設定のままにします。
EXPORT_LAST_CHECKPOINT_ONLY: 省略可: 最新のチェックポイントのみを使用する場合は、true に設定します。
TUNED_MODEL_DISPLAYNAME: 省略可。チューニングされたモデルの表示名。設定されていない場合は、ランダムな名前が生成されます。
KMS_KEY_NAME: 省略可。リソースの保護に使用される顧客管理の暗号鍵の Cloud KMS リソース ID。キーの形式は projects/my-project/locations/my-region/keyRings/my-kr/cryptoKeys/my-key です。鍵は、コンピューティングリソースが作成されているのと同じリージョンに存在する必要があります。詳細については、顧客管理の暗号鍵（CMEK）をご覧ください。
SERVICE_ACCOUNT: 省略可。チューニングジョブワークロードが実行されるサービスアカウント。指定しない場合、プロジェクト内の Vertex AI セキュアファインチューニングサービスエージェントが使用されます。チューニングサービスエージェントをご覧ください。顧客管理のサービスアカウントを使用する場合は、サービスアカウントに roles/aiplatform.tuningServiceAgent ロールを付与する必要があります。また、顧客管理のサービスアカウントにチューニングサービスエージェント roles/iam.serviceAccountTokenCreator ロールを付与します。

HTTP メソッドと URL:

POST https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs

リクエストの本文（JSON）:

{
  "baseModel": "BASE_MODEL",
  "preferenceOptimizationSpec" : {
      "trainingDatasetUri": "TRAINING_DATASET_URI",
      "validationDatasetUri": "VALIDATION_DATASET_URI",
      "hyperParameters": {
          "epochCount": "EPOCH_COUNT",
          "beta": "BETA",
          "adapterSize": "ADAPTER_SIZE",
          "learningRateMultiplier": "LEARNING_RATE_MULTIPLIER"
      },
      "exportLastCheckpointOnly": EXPORT_LAST_CHECKPOINT_ONLY,
  },
  "tunedModelDisplayName": "TUNED_MODEL_DISPLAYNAME",
  "encryptionSpec": {
    "kmsKeyName": "KMS_KEY_NAME"
  },
  "serviceAccount": "SERVICE_ACCOUNT"
}

リクエストを送信するには、次のいずれかのオプションを展開します。

curl（Linux、macOS、Cloud Shell）

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ユーザーアカウントで gcloud CLI にログインしているか、Cloud Shell を使用して自動的に gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs"

PowerShell（Windows）

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ご自分のユーザーアカウントで gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs" | Select-Object -Expand Content

curl コマンドの例

PROJECT_ID=myproject
LOCATION=global
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/tuningJobs" \
-d \
$'{
   "baseModel": "${BASE_MODEL}",
   "preferenceOptimizationSpec" : {
      "trainingDatasetUri": "gs://mybucket/preference_tuning/data/train_data.jsonl",
      "validationDatasetUri": "gs://mybucket/preference_tuning/data/validation_data.jsonl"
   },
   "tunedModelDisplayName": "tuned_gemini"
}'

ハイパーパラメータのチューニング

最初のチューニングジョブは、ハイパーパラメータを変更せずに送信することをおすすめします。デフォルト値はモデル出力の品質を最大限に高めることが期待される、ベンチマークの結果に基づく推奨値です。

エポック: トレーニング中にモデルがトレーニングデータセット全体に対して行う完全なパスの数。Vertex AI では、トレーニングデータセットのサイズに合わせてデフォルト値が自動的に調整されます。この値はベンチマークの結果に基づいて、モデル出力の品質を最適化します。
ベータ版: チューニングされたモデルがベースラインにどの程度適合するかを制御する係数。ベータ版の値が小さいほど、優先される回答に向けてより積極的に更新されます。推奨範囲は 0.01～0.5 です（両端を含む）。ベータ値が 0 の場合、モデルは学習を停止します。
アダプタのサイズ: チューニングジョブに使用するアダプタのサイズ。チューニングジョブのアダプタのサイズは、トレーニング可能なパラメータの数に影響します。アダプタサイズが大きいほど、モデルはより複雑なタスクを学習できますが、より大きなトレーニングデータセットと長いトレーニング時間が必要になります。
学習率の乗数: 推奨学習率に適用する乗数。この値を増やすと収束が早まり、値を減らすと過学習を回避できます。

チューニングジョブを表示またはキャンセルする

チューニングジョブのリスト表示、チューニングジョブの詳細の表示、チューニングジョブのキャンセル、チューニング済みモデルの削除を行うには、教師ありファインチューニングのドキュメントの次のセクションをご覧ください。

モデルチューニングの指標

モデルのチューニングジョブは、次のチューニング指標を自動的に収集します。

/preference_optimization_train_loss: トレーニングステップでのチューニングデータセットのプリファレンスの損失。

モデル検証の指標

検証データが提供されると、モデルのチューニングジョブは次の検証指標を自動的に収集します。

/eval_total_loss: 検証ステップでの検証データセットのプリファレンスの損失。

指標の可視化は、チューニングジョブの実行が開始された後に利用できます。チューニングの進行に応じてリアルタイムで更新されます。チューニングジョブの作成時に検証データセットを指定しなかった場合、チューニング指標の可視化のみを行うことができます。

次のステップ

チューニング済み Gemini モデルのデプロイについて確認する。

プリファレンス チューニングを使用して Gemini モデルをチューニングする コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

始める前に

調整ジョブを作成する

コンソール

REST

curl（Linux、macOS、Cloud Shell）

PowerShell（Windows）

curl コマンドの例

ハイパーパラメータのチューニング

チューニング ジョブを表示またはキャンセルする

モデル チューニングの指標

モデル検証の指標

次のステップ

プリファレンスチューニングを使用して Gemini モデルをチューニングする

チューニングジョブを表示またはキャンセルする

モデルチューニングの指標