Method: projects.locations.collections.dataStores.trainCustomModel

Entraîne un modèle personnalisé.

Requête HTTP

POST https://discoveryengine.googleapis.com/v1alpha/{dataStore=projects/*/locations/*/collections/*/dataStores/*}:trainCustomModel

L'URL utilise la syntaxe de transcodage gRPC.

Paramètres de chemin d'accès

Paramètres
dataStore

string

Obligatoire. Nom de ressource du magasin de données, tel que projects/*/locations/global/collections/default_collection/dataStores/default_data_store. Ce champ permet d'identifier le data store dans lequel entraîner les modèles.

Corps de la requête

Le corps de la requête contient des données présentant la structure suivante :

Représentation JSON
{
  "modelType": string,
  "errorConfig": {
    object (ImportErrorConfig)
  },
  "modelId": string,

  // Union field training_input can be only one of the following:
  "gcsTrainingInput": {
    object (GcsTrainingInput)
  }
  // End of list of possible types for union field training_input.
}
Champs
modelType

string

Modèle à entraîner. Valeurs acceptées :

  • search-tuning : ajustement précis du système de recherche en fonction des données fournies.
errorConfig

object (ImportErrorConfig)

Emplacement souhaité des erreurs survenues lors de l'ingestion et de l'entraînement des données.

modelId

string

Si vous n'en fournissez pas, un UUID est généré.

Champ d'union training_input. Entrée d'entraînement du modèle. training_input ne peut être qu'un des éléments suivants :
gcsTrainingInput

object (GcsTrainingInput)

Entrée d'entraînement Cloud Storage.

Corps de la réponse

Si la requête aboutit, le corps de la réponse contient une instance de Operation.

Niveaux d'accès des autorisations

Nécessite l'un des niveaux d'accès OAuth suivants :

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/discoveryengine.readwrite
  • https://www.googleapis.com/auth/discoveryengine.serving.readwrite

Pour plus d'informations, consultez la page Authentication Overview.

Autorisations IAM

Nécessite l'autorisation IAM suivante sur la ressource dataStore :

  • discoveryengine.dataStores.trainCustomModel

Pour en savoir plus, consultez la documentation IAM.

GcsTrainingInput

Entrée des données d'entraînement Cloud Storage.

Représentation JSON
{
  "corpusDataPath": string,
  "queryDataPath": string,
  "trainDataPath": string,
  "testDataPath": string
}
Champs
corpusDataPath

string

Données de corpus Cloud Storage pouvant être associées aux données d'entraînement. Le format du chemin d'accès aux données est gs://<bucket_to_data>/<jsonl_file_name>. Fichier jsonl/ndjson délimité par un retour à la ligne.

Pour le modèle d'ajustement de la recherche, chaque ligne doit comporter l'ID, le titre et le texte. Exemple : {"Id": "doc1", title: "relevant doc", "text": "relevant text"}

queryDataPath

string

Données de requête GCS pouvant être associées aux données d'entraînement. Le format du chemin d'accès aux données est gs://<bucket_to_data>/<jsonl_file_name>. Fichier jsonl/ndjson délimité par un retour à la ligne.

Pour le modèle d'ajustement de la recherche, chaque ligne doit comporter l'ID et le texte. Exemple : {"Id": "query1", "text": "example query"}

trainDataPath

string

Chemin d'accès aux données d'entraînement Cloud Storage, dont le format doit être gs://<bucket_to_data>/<tsv_file_name>. Le fichier doit être au format TSV. Chaque ligne doit comporter le docId, le queryId et le score (nombre).

Pour le modèle d'ajustement de la recherche, l'en-tête du fichier TSV doit contenir l'ID de la requête, l'ID du corpus et le score. Le score doit être un nombre compris dans l'intervalle [0, inf+). Plus le nombre est élevé, plus la paire est pertinente. Exemple :

  • query-id\tcorpus-id\tscore
  • query1\tdoc1\t1
testDataPath

string

Données de test Cloud Storage. Même format que trainDataPath. Si vous n'en fournissez pas, une division aléatoire 80/20 entre les données d'entraînement et de test est effectuée sur trainDataPath.