Method: projects.locations.collections.dataStores.trainCustomModel

Entrena un modelo personalizado.

Solicitud HTTP

POST https://discoveryengine.googleapis.com/v1/{dataStore=projects/*/locations/*/collections/*/dataStores/*}:trainCustomModel

La URL usa la sintaxis de la transcodificación gRPC.

Parámetros de ruta

Parámetros
dataStore

string

Obligatorio. El nombre del recurso del almacén de datos, como projects/*/locations/global/collections/default_collection/dataStores/default_data_store. Este campo se usa para identificar el almacén de datos en el que se entrenarán los modelos.

Cuerpo de la solicitud

El cuerpo de la solicitud contiene datos con la siguiente estructura:

Representación JSON
{
  "modelType": string,
  "errorConfig": {
    object (ImportErrorConfig)
  },
  "modelId": string,

  // Union field training_input can be only one of the following:
  "gcsTrainingInput": {
    object (GcsTrainingInput)
  }
  // End of list of possible types for union field training_input.
}
Campos
modelType

string

Modelo que se entrenará. Los valores admitidos son los que se detallan a continuación:

  • search-tuning: Ajuste preciso del sistema de búsqueda en función de los datos proporcionados.
errorConfig

object (ImportErrorConfig)

La ubicación deseada de los errores que se producen durante la ingesta y el entrenamiento de datos.

modelId

string

Si no se proporciona, se generará un UUID.

Campo de unión training_input. Entrada de entrenamiento de modelos. training_input puede ser solo uno de los parámetros siguientes:
gcsTrainingInput

object (GcsTrainingInput)

Entrada de entrenamiento de Cloud Storage.

Cuerpo de la respuesta

Si se ejecuta de forma correcta, el cuerpo de la respuesta contiene una instancia de Operation.

Alcances de autorización

Se necesita uno de los siguientes permisos de OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/discoveryengine.readwrite
  • https://www.googleapis.com/auth/discoveryengine.serving.readwrite

Para obtener más información, consulta Authentication Overview.

Permisos de IAM

Se requiere el siguiente permiso de IAM en el recurso dataStore:

  • discoveryengine.dataStores.trainCustomModel

Para obtener más información, consulta la documentación de IAM.

GcsTrainingInput

Entrada de datos de entrenamiento de Cloud Storage.

Representación JSON
{
  "corpusDataPath": string,
  "queryDataPath": string,
  "trainDataPath": string,
  "testDataPath": string
}
Campos
corpusDataPath

string

Los datos del corpus de Cloud Storage que se podrían asociar en los datos de entrenamiento. El formato de la ruta de acceso de los datos es gs://<bucket_to_data>/<jsonl_file_name>. Un archivo jsonl/ndjson delimitado por saltos de línea.

Para el modelo de ajuste de búsqueda, cada línea debe tener el ID, el título y el texto. Ejemplo: {"Id": "doc1", title: "relevant doc", "text": "relevant text"}

queryDataPath

string

Los datos de consulta de GCS que se podrían asociar en los datos de entrenamiento. El formato de la ruta de acceso de los datos es gs://<bucket_to_data>/<jsonl_file_name>. Un archivo jsonl/ndjson delimitado por saltos de línea.

Para el modelo de ajuste de búsqueda, cada línea debe tener el ID y el texto. Ejemplo: {"Id": "query1", "text": "example query"}

trainDataPath

string

La ruta de acceso de los datos de entrenamiento de Cloud Storage cuyo formato debe ser gs://<bucket_to_data>/<tsv_file_name>. Este archivo debe estar en formato TSV. Cada línea debe tener el docId, el queryId y la puntuación (número).

Para el modelo de ajuste de búsqueda, debe tener la puntuación de ID de corpus de ID de consulta como encabezado de archivo TSV. La puntuación debe ser un número en [0, inf+). Cuanto mayor sea el número, más relevante será el par. Ejemplo:

  • query-id\tcorpus-id\tscore
  • query1\tdoc1\t1
testDataPath

string

Datos de prueba de Cloud Storage. El mismo formato que trainDataPath. Si no se proporciona, se realizará una división aleatoria de 80/20 de entrenamiento/prueba en trainDataPath.