Method: projects.locations.collections.dataStores.trainCustomModel

Melatih model kustom.

Permintaan HTTP

POST https://discoveryengine.googleapis.com/v1beta/{dataStore=projects/*/locations/*/collections/*/dataStores/*}:trainCustomModel

URL menggunakan sintaks gRPC Transcoding.

Parameter jalur

Parameter
dataStore

string

Wajib. Nama resource Penyimpanan Data, seperti projects/*/locations/global/collections/default_collection/dataStores/default_data_store. Kolom ini digunakan untuk mengidentifikasi penyimpanan data tempat melatih model.

Isi permintaan

Isi permintaan memuat data dengan struktur berikut:

Representasi JSON
{
  "modelType": string,
  "errorConfig": {
    object (ImportErrorConfig)
  },
  "modelId": string,

  // Union field training_input can be only one of the following:
  "gcsTrainingInput": {
    object (GcsTrainingInput)
  }
  // End of list of possible types for union field training_input.
}
Kolom
modelType

string

Model yang akan dilatih. Nilai yang didukung adalah:

  • search-tuning: Menyesuaikan sistem penelusuran berdasarkan data yang diberikan.
errorConfig

object (ImportErrorConfig)

Lokasi yang diinginkan untuk error yang terjadi selama penyerapan dan pelatihan data.

modelId

string

Jika tidak diberikan, UUID akan dibuat.

Kolom union training_input. Input pelatihan model. training_input hanya ada berupa salah satu diantara berikut:
gcsTrainingInput

object (GcsTrainingInput)

Input pelatihan Cloud Storage.

Isi respons

Jika berhasil, isi respons akan berisi instance Operation.

Cakupan otorisasi

Memerlukan salah satu cakupan OAuth berikut:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/discoveryengine.readwrite

Untuk mengetahui informasi selengkapnya, lihat Authentication Overview.

Izin IAM

Memerlukan izin IAM berikut pada resource dataStore:

  • discoveryengine.dataStores.trainCustomModel

Untuk mengetahui informasi selengkapnya, lihat dokumentasi IAM.

GcsTrainingInput

Input data pelatihan Cloud Storage.

Representasi JSON
{
  "corpusDataPath": string,
  "queryDataPath": string,
  "trainDataPath": string,
  "testDataPath": string
}
Kolom
corpusDataPath

string

Data korpus Cloud Storage yang dapat dikaitkan dalam data pelatihan. Format jalur data adalah gs://<bucket_to_data>/<jsonl_file_name>. File jsonl/ndjson yang dibatasi baris baru.

Untuk model penyesuaian penelusuran, setiap baris harus memiliki ID, judul, dan teks. Contoh: {"Id": "doc1", title: "relevant doc", "text": "relevant text"}

queryDataPath

string

Data kueri gcs yang dapat dikaitkan dalam data pelatihan. Format jalur data adalah gs://<bucket_to_data>/<jsonl_file_name>. File jsonl/ndjson yang dibatasi baris baru.

Untuk model penyesuaian penelusuran, setiap baris harus memiliki ID dan teks. Contoh: {"Id": "query1", "text": "example query"}

trainDataPath

string

Jalur data pelatihan Cloud Storage yang formatnya harus gs://<bucket_to_data>/<tsv_file_name>. File harus dalam format tsv. Setiap baris harus memiliki docId, queryId, dan skor (angka).

Untuk model penyesuaian penelusuran, model harus memiliki skor query-id corpus-id sebagai header file tsv. Skor harus berupa angka dalam [0, inf+). Makin besar angkanya, makin relevan pasangan tersebut. Contoh:

  • query-id\tcorpus-id\tscore
  • query1\tdoc1\t1
testDataPath

string

Data pengujian Cloud Storage. Format yang sama dengan trainDataPath. Jika tidak diberikan, pemisahan pelatihan/pengujian 80/20 acak akan dilakukan di trainDataPath.