מאמנת מודל בהתאמה אישית.
בקשת HTTP
POST https://discoveryengine.googleapis.com/v1/{dataStore=projects/*/locations/*/collections/*/dataStores/*}:trainCustomModel
כתובת ה-URL כתובה בתחביר של gRPC Transcoding.
פרמטרים של נתיב
| פרמטרים | |
|---|---|
dataStore |
חובה. שם המשאב של מאגר הנתונים, למשל |
גוף הבקשה
גוף הבקשה מכיל נתונים במבנה הבא:
| ייצוג ב-JSON |
|---|
{ "modelType": string, "errorConfig": { object ( |
| שדות | |
|---|---|
modelType |
המודל שאותו רוצים לאמן. הערכים הנתמכים הם:
|
errorConfig |
המיקום הרצוי של השגיאות שמתרחשות במהלך הטמעת הנתונים והאימון. |
modelId |
אם לא מספקים מזהה ייחודי אוניברסלי (UUID), המערכת יוצרת אותו. |
שדה איחוד training_input. קלט לאימון המודל. הערך training_input יכול להיות רק אחד מהבאים: |
|
gcsTrainingInput |
קלט לאימון ב-Cloud Storage. |
גוף התשובה
אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע של Operation.
היקפי הרשאות
נדרש אחד מהיקפי ההרשאות הבאים של OAuth:
https://www.googleapis.com/auth/cloud-platformhttps://www.googleapis.com/auth/discoveryengine.readwrite
ניתן למצוא מידע נוסף כאן: Authentication Overview.
הרשאות IAM
נדרשת הרשאת IAM הבאה במשאב dataStore:
discoveryengine.dataStores.trainCustomModel
מידע נוסף מופיע במאמרי העזרה בנושא IAM.
GcsTrainingInput
קלט של נתוני אימון ב-Cloud Storage.
| ייצוג ב-JSON |
|---|
{ "corpusDataPath": string, "queryDataPath": string, "trainDataPath": string, "testDataPath": string } |
| שדות | |
|---|---|
corpusDataPath |
נתוני הקורפוס של Cloud Storage שיכולים להיות משויכים לנתוני האימון. הפורמט של נתיב הנתונים הוא במודל להתאמה אישית של חיפושים, כל שורה צריכה לכלול את המזהה, הכותרת והטקסט. לדוגמה: |
queryDataPath |
נתוני השאילתות ב-GCS שאפשר לשייך לנתוני האימון. הפורמט של נתיב הנתונים הוא במודל להתאמת חיפוש, כל שורה צריכה לכלול את המזהה והטקסט. דוגמה: {"Id": "query1", "text": "example query"} |
trainDataPath |
נתיב נתוני האימון ב-Cloud Storage, שהפורמט שלו צריך להיות במודל לשיפור החיפוש, הכותרת של קובץ ה-TSV צריכה להיות query-id corpus-id score. הניקוד צריך להיות מספר בטווח
|
testDataPath |
נתוני בדיקה של Cloud Storage. אותו פורמט כמו trainDataPath. אם לא תציינו חלוקה, המערכת תבצע חלוקה אקראית של 80/20 בין נתוני האימון לנתוני הבדיקה ב-trainDataPath. |