Method: projects.locations.collections.dataStores.trainCustomModel

Entrena un modelo personalizado.

Solicitud HTTP

POST https://discoveryengine.googleapis.com/v1beta/{dataStore=projects/*/locations/*/collections/*/dataStores/*}:trainCustomModel

La URL utiliza la sintaxis de transcodificación a gRPC.

Parámetros de ruta

Parámetros
dataStore

string

Obligatorio. Nombre de recurso del almacén de datos, como projects/*/locations/global/collections/default_collection/dataStores/default_data_store. Este campo se usa para identificar el almacén de datos en el que se entrenarán los modelos.

Cuerpo de la solicitud

El cuerpo de la solicitud contiene datos que presentan la siguiente estructura:

Representación JSON
{
  "modelType": string,
  "errorConfig": {
    object (ImportErrorConfig)
  },
  "modelId": string,

  // Union field training_input can be only one of the following:
  "gcsTrainingInput": {
    object (GcsTrainingInput)
  }
  // End of list of possible types for union field training_input.
}
Campos
modelType

string

Modelo que se va a entrenar. Los valores admitidos son:

  • search-tuning: ajuste preciso del sistema de búsqueda en función de los datos proporcionados.
errorConfig

object (ImportErrorConfig)

Ubicación deseada de los errores producidos durante la ingestión y el entrenamiento de los datos.

modelId

string

Si no se proporciona, se generará un UUID.

Campo de unión training_input. Entrada de entrenamiento del modelo. training_input solo puede ser una de estas dos opciones:
gcsTrainingInput

object (GcsTrainingInput)

Entrada de entrenamiento de Cloud Storage.

Cuerpo de la respuesta

Si la solicitud se hace correctamente, en el cuerpo de la respuesta se incluye una instancia de Operation.

Permisos de autorización

Debes disponer de uno de los siguientes permisos de OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/discoveryengine.readwrite

Para obtener más información, consulta el Authentication Overview.

Permisos de IAM

Requiere el siguiente permiso de gestión de identidades y accesos en el recurso dataStore:

  • discoveryengine.dataStores.trainCustomModel

Para obtener más información, consulta la documentación de gestión de identidades y accesos.

GcsTrainingInput

Datos de entrada de entrenamiento de Cloud Storage.

Representación JSON
{
  "corpusDataPath": string,
  "queryDataPath": string,
  "trainDataPath": string,
  "testDataPath": string
}
Campos
corpusDataPath

string

Los datos del corpus de Cloud Storage que se pueden asociar a los datos de entrenamiento. El formato de la ruta de datos es gs://<bucket_to_data>/<jsonl_file_name>. Un archivo jsonl o ndjson delimitado por líneas nuevas.

En el caso del modelo de ajuste de búsqueda, cada línea debe tener el ID, el título y el texto. Ejemplo: {"Id": "doc1", title: "relevant doc", "text": "relevant text"}

queryDataPath

string

Los datos de consulta de GCS que se podrían asociar a los datos de entrenamiento. El formato de la ruta de datos es gs://<bucket_to_data>/<jsonl_file_name>. Un archivo jsonl o ndjson delimitado por líneas nuevas.

En el caso del modelo de ajuste de búsqueda, cada línea debe tener el ID y el texto. Ejemplo: {"Id": "query1", "text": "example query"}

trainDataPath

string

Ruta de los datos de entrenamiento de Cloud Storage cuyo formato debe ser gs://<bucket_to_data>/<tsv_file_name>. El archivo debe estar en formato TSV. Cada línea debe tener el docId, el queryId y la puntuación (número).

En el caso del modelo de ajuste de búsqueda, debe tener la consulta, el ID del corpus y la puntuación como encabezado de archivo TSV. La puntuación debe ser un número de [0, inf+). Cuanto mayor sea el número, más relevante será el par. Por ejemplo:

  • query-id\tcorpus-id\tscore
  • query1\tdoc1\t1
testDataPath

string

Datos de prueba de Cloud Storage. Tiene el mismo formato que trainDataPath. Si no se proporciona, se realizará una división aleatoria del 80 % para el entrenamiento y el 20 % para las pruebas en trainDataPath.