Note: Vertex AI Search is being renamed to Agent Search. We are in the process of updating content to reflect the new branding.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

סינון באמצעות הבנת שפה טבעית

בדף הזה מוסבר איך להשתמש בהבנת שפה טבעית כדי ליצור מסננים אוטומטיים לשאילתות חיפוש, וכך לשפר את איכות התוצאות שמוחזרות.

אפשר להשתמש בתכונה הזו עם אפליקציות חיפוש שמחוברות למאגרי נתונים מובְנים.

מידע על הבנת שאילתות בשפה טבעית

אם יש לכם אפליקציית חיפוש בהתאמה אישית עם נתונים מובְנים, אפשר לעצב מחדש את השאילתות בשפה טבעית של המשתמשים שלכם כשאילתות מסוננות. התוצאה היא תוצאות חיפוש איכותיות יותר מאשר חיפוש מילים במחרוזת השאילתה.

לדוגמה, שאילתה בשפה טבעית כמו "Find a coffee shop serving banana bread" יכולה להיות מנוסחת מחדש כשאילתה ומסנן: "query": "banana bread", "filter": "type": ANY(\"cafe\").

השימוש בהבנת שאילתות בשפה טבעית קל וגמיש יותר מכתיבת ביטויי מסננים משלכם. מידע על כתיבת ביטויי מסננים זמין במאמר סינון חיפוש מותאם אישית של נתונים מובְנים או לא מובְנים.

מסננים קשים ורכים

יש שני סוגים של מסננים שאפשר להחיל על הבנת שאילתות בשפה טבעית: מסננים קשיחים ומסננים רכים.

קשה. כברירת מחדל, המסננים שחולצו מוחלים כקריטריונים מחייבים שתוצאה צריכה לעמוד בהם כדי להיות מוחזרת.

ההתנהגות דומה לזו של השדה filter בבקשת החיפוש.
רך. אפשרות נוספת במקום מסנן קשיח היא להחיל חיזוק על תוצאות החיפוש. יש סיכוי גבוה יותר שהתוצאות המודגשות יוחזרו, אבל יכול להיות שיוחזרו גם תוצאות שלא עומדות בקריטריון ההדגשה.

ההתנהגות דומה לזו של השדה boostSpec בבקשת החיפוש.

אתם יכולים להתנסות בשני סוגי המסננים. אם החיפושים לא מחזירים מספיק תוצאות, כדאי לנסות את המסנן הרך במקום המסנן הקשיח.

פרטים על הפעלת מסנן רך מופיעים בקטע חיפוש באמצעות מסנן רך בהמשך.

דוגמאות

הדרך הכי טובה להסביר את התכונה הזו היא באמצעות דוגמאות:

דוגמה: חילוץ שדות משאילתות (מסנן קשיח) מציגה את מסנני השדות שחולצו מהשאילתה.
דוגמה: עם מסנן מיקום גיאוגרפי (מסנן קשיח) כולל את המקרה המיוחד של מסנן המיקום הגיאוגרפי.
דוגמה: חילוץ שדה משאילתות (מסנן רך) מציגה את המסנן הרך שחולץ משאילתה שנשלחה לאפליקציה משולבת.

דוגמה: חילוץ שדות משאילתות (מסנן קשיח)

התכונה הזו של הבנת שאילתות בשפה טבעית מוסברת באמצעות דוגמה של חיפוש מלון.

הנה שאילתה שמוגשת למאגר נתונים מובנה באתר של מלון: "תמצא לי מלון שמתאים למשפחות עם ארבעה כוכבים לפחות, שעולה פחות מ-300 ללילה, שאפשר להביא אליו כלב ויש בו Wi-Fi בחינם".

בלי הבנת שאילתות בשפה טבעית, אפליקציית החיפוש מחפשת מסמכים שמכילים את המילים בשאילתה.

בעזרת הבנה של שאילתות בשפה טבעית ונתונים מובְנים בצורה מתאימה, החיפוש יעיל יותר כי חלק מהשפה הטבעית בשאילתה מוחלף במסננים. אם הנתונים המובנים כוללים שדות של star_rating (מספרים), price (מספרים) ו-amenities (מחרוזות), אפשר לנסח את השאילתה כך שתכלול את המסננים הבאים:

   {
       "star_rating": >=4,
       "price": <=300,
       "amenities": "Wifi", "Pets Allowed"
   }

דוגמה: עם מסנן מיקום גיאוגרפי (מסנן קשיח)

הדוגמה הזו דומה לדוגמה הקודמת, אבל היא כוללת מסנן מיקום גיאוגרפי, שהוא סוג מיוחד של מסנן שחולץ. ל-Agent Search יש יכולת לזהות מיקומים בשאילתה וליצור מסנני קרבה למיקומים.

קחו את השאילתה הבאה שהוגשה לאתר עסקי ברמת המדינה: "תמצא לי מלון אופנתי ומסוגנן עם 4 כוכבים לפחות בסן פרנסיסקו".

בעזרת ההבנה של שאילתות בשפה טבעית והמסנן של מיקום גיאוגרפי, החיפוש מנוסח מחדש כך שיכלול את המסנן הבא למלון עם דירוג של 4 כוכבים לפחות ברדיוס של 10 ק"מ מסן פרנסיסקו:

   {
       "star_rating": >=4,
       "location": GEO_DISTANCE(\"San Francisco, CA\", 10000)
   }

בדוגמה הזו, GEO_DISTANCE היא כתובת, אבל בשאילתות אחרות היא יכולה להיות כתובה כקו רוחב וקו אורך, גם אם השאילתה המקורית הכילה כתובת.

דוגמה: חילוץ שדות משאילתות (מסנן רך)

התכונה הזו של הבנת שאילתות בשפה טבעית מוסברת באמצעות דוגמה של חיפוש מלון, אבל מוצגות כמה תוצאות שלא עומדות בכל הקריטריונים.

הנה שאילתה שמוגשת לאתר נסיעות: "תמצא לי מלון שמתאים למשפחות עם לפחות ארבעה כוכבים, שעולה פחות מ-300 ללילה ומאפשר להביא כלב".

החיפוש הופך ליעיל יותר באמצעות החלפה של חלק מהשפה הטבעית בשאילתה במסננים רכים, בעזרת הבנה של שאילתות בשפה טבעית ונתונים מובנים בצורה מתאימה. אם הנתונים המובְנים כוללים שדות של star_rating (מספרים), price (מספרים) ו-amenities (מחרוזות), אפשר לשכתב את השאילתה כך שתכלול את ההגברה הבאה:

תנאי ההגברה שחולץ מהשאילתה בשפה הטבעית:

{
  "boostSpec": {
    "conditionBoostSpecs": {
      "condition": "(star_rating >= 4.5) AND (price < 200) AND ANY(amenities, \"Pets Allowed\")",
      "boost": 0.7
    }
  }
}

במקרה כזה, יכול להיות שיוצגו מלונות עם דירוג נמוך יותר או מלונות שלא מאפשרים כניסה של חיות מחמד.

עוצמת ההדגשה תלויה במספר המסננים המובנים שהמסמך תואם להם. אם שלוש תנאים מחולצים והמסמך תואם רק לאחד מהתנאים, המסמך מקבל דחיפה קטנה. לחלופין, אם המסמך עומד בכל שלושת התנאים, הוא מקבל דחיפה משמעותית.

מגבלות

ההגבלות הבאות חלות על הבנת שאילתות בשפה טבעית:

אי אפשר להחיל הבנה של שאילתות בשפה טבעית על אפליקציות חיפוש משולבות. אם תנסו להשתמש בהבנת שאילתות בשפה טבעית באפליקציית חיפוש משולב, תקבלו שגיאה.
הבנת שאילתות בשפה טבעית פועלת רק באפליקציות חיפוש בהתאמה אישית שמשתמשות במאגרי נתונים מובְנים.
שימוש בהבנת שאילתות בשפה טבעית מגדיל את זמן האחזור, ולכן יכול להיות שתבחרו לא להשתמש בה אם זמן האחזור הוא בעיה.
במקרה של מיקום גיאוגרפי, צריך לתאר את המיקום באופן מפורש. אי אפשר להשתמש במיקומים כמו 'בסביבה שלי' או 'הבית שלי'.
הרדיוס של המיקום הגיאוגרפי הוא 10 ק"מ ואי אפשר להגדיר אותו.
אי אפשר להשתמש בשדות בוליאניים במסננים. לדוגמה, אם השאילתה היא "Find me a non-smoking hotel room", אז שדה בוליאני כמו "non_smoking": true לא שימושי, אבל שדה מחרוזת כמו "non_smoking": "YES" יכול להיות חלק מהמסנן.

לפני שמתחילים

לפני שמתחילים להשתמש בהבנת שאילתות בשפה טבעית, צריך להפעיל אותה במאגרי הנתונים המובנים שמקושרים לאפליקציות שמתכננים להשתמש בהן.

כדי להפעיל את ההבנה של שאילתות בשפה טבעית:

REST

איך מוצאים את המזהה של מאגר הנתונים אם כבר יש לכם מזהה של מאגר נתונים, אפשר לדלג לשלב הבא.
1. במסוף Google Cloud , עוברים לדף AI Applications ובתפריט הניווט לוחצים על Data Stores.
  
  מעבר לדף Data Stores
2. לוחצים על השם של מאגר הנתונים.
3. בדף Data של מאגר הנתונים, מעתיקים את המזהה של מאגר הנתונים.

מריצים את פקודת ה-curl הבאה:

curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID?update_mask=natural_language_query_understanding_config.mode" \
-d '{
      "naturalLanguageQueryUnderstandingConfig": {
        "mode": "ENABLED"
      }
    }'

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
‫DATA_STORE_ID: המזהה של מאגר הנתונים של חיפוש מבוסס סוכנים.

דוגמה לפקודה ולתשובה

curl -X PATCH
-H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
-H "X-Goog-User-Project: my-project-123"
"https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store?update_mask=natural_language_query_understanding_config.mode"
-d '{
       "naturalLanguageQueryUnderstandingConfig": {
         "mode": "ENABLED"
       }
    }'

{
  "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store",
  "displayName": "test_data_store",
  "industryVertical": "GENERIC",
  "createTime": "2024-07-10T18:50:01.673414Z",
  "solutionTypes": [
    "SOLUTION_TYPE_SEARCH"
  ],
  "defaultSchemaId": "default_schema",
  "documentProcessingConfig": {
    "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store/documentProcessingConfig",
    "defaultParsingConfig": {
      "digitalParsingConfig": {}
    }
  },
  "servingConfigDataStore": {},
  "naturalLanguageQueryUnderstandingConfig": {
    "mode": "ENABLED"
  }
}

חוזרים על שלבים 1 ו-2 לכל מאגר נתונים.
ממתינים כ-24 שעות.

אם תנסו להשתמש בהבנת שאילתות בשפה טבעית לפני שמאגר הנתונים יהיה מוכן, התשובה שתקבלו תהיה זהה לתשובה שתקבלו אם filterExtractionCondition יוגדר כ-DISABLED.

חיפוש, המרה של שאילתות בשפה טבעית למסננים

כדי לחפש שאילתה בשפה טבעית ולקבל תוצאות שעברו אופטימיזציה לשאילתות בשפה טבעית, צריך לפעול לפי השלבים הבאים:

REST

מריצים את פקודת ה-curl הבאה, שמפעילה את השיטה search:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED"
        }
      }'

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
APP_ID: המזהה של אפליקציית חיפוש מבוסס סוכנים שרוצים לשלוח אליה שאילתה. האפליקציה צריכה להיות מקושרת למאגר נתונים שמכיל נתונים מובְנים. האפליקציה לא יכולה להיות אפליקציה של חיפוש משולב.
‫QUERY: השאילתה שנכתבה בשפה טבעית.

דוגמה לפקודה ולתוצאה חלקית

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED"}
}'

{
"results": [
{
  "id": "b2617d862",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
    ...
  }
},
{
  "id": "a51841841",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
    ...
  }
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(amenities: ANY(\"Pets Allowed\") AND amenities: ANY(\"Wifi\") AND star_rating: >= 4 AND price: < 300)",
"extractedFilterStructured": {
  "expression": {
    "andExpr": {
      "expressions": [
        {
          "numberConstraint": {
            "fieldName": "star_rating",
            "value": 4,
            "comparison": "GREATER_THAN_EQUALS",
          }
        },
        {
          "numberConstraint": {
            "fieldName": "price",
            "value": 300,
            "comparison": "LESS_THAN",
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Pets Allowed"]
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Wifi"]
          }
        },
      ]
    }

חיפוש, המרה של מיקומים בשאילתות למסנני מיקום גיאוגרפי

כדי לחפש שאילתה בשפה טבעית ולקבל תוצאות שעברו אופטימיזציה לשאילתות בשפה טבעית, כולל קרבה למיקומים, צריך לפעול לפי השלבים הבאים:

REST

מריצים את פקודת ה-curl הבאה, שמפעילה את השיטה search:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "geoSearchQueryDetectionFieldNames": ["GEO_FIELD_NAME_1", "GEO_FIELD_NAME_N"]"
        }
      }'

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
APP_ID: המזהה של אפליקציית חיפוש מבוסס סוכנים שרוצים לשלוח אליה שאילתה. האפליקציה צריכה להיות מקושרת למאגר נתונים שמכיל נתונים מובְנים. האפליקציה לא יכולה להיות אפליקציה של חיפוש משולב.
‫QUERY: השאילתה שנכתבה בשפה טבעית.
‫GEO_FIELD_NAME_1, GEO_FIELD_NAME_N: רשימה של ערכים מסוג geolocation. אם סוג הערך לא geolocation, המערכת מתעלמת מהשדה הזה.

דוגמה לפקודה ולתוצאה

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a chic and stylish hotel with at least 4 stars that is in San Francisco.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED",
  "geoSearchQueryDetectionFieldNames": ["location"]}
}'

{
"results": [
{
"id": "b2617d862",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
...
}
},
{
"id": "a51841841",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
...
}
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(star_rating: >= 4 AND GEO_DISTANCE("location", "San Francisco", 10000))",
"extractedFilterStructured": {
"expression": {
"andExpr": {
  "expressions": [
    {
      "numberConstraint": {
        "fieldName": "star_rating",
        "value": 4,
        "comparison": "GREATER_THAN_EQUALS",
      }
    },
    {
      "geolocationConstraint": {
        "fieldName": "location",
        "address": "San Francisco",
        "radius_in_meters": 10000,
      }
    },
  ]
}

חיפוש עם מסנן רך

כדי להחיל מסנן רך:

REST

מאתרים את מזהה האפליקציה. אם כבר יש לכם מזהה אפליקציה, דלגו לשלב הבא.
1. נכנסים לדף AI Applications במסוף Google Cloud .
  
  מעבר אל 'אפליקציות'
2. בדף אפליקציות, מאתרים את שם האפליקציה ומעתיקים את המזהה שלה מהעמודה מזהה.

מריצים את פקודת ה-curl הבאה, שמפעילה את השיטה search:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
‫APP_ID: המזהה של אפליקציית החיפוש. האפליקציה צריכה להיות מקושרת למאגר נתונים שמכיל נתונים מובְנים. האפליקציה לא יכולה להיות אפליקציה של חיפוש משולב.
‫QUERY: השאילתה בשפה טבעית.

דוגמה לפקודה ולתשובה חלקית

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search" \
  -d '{
        "query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

{
  "results": [
    {
      "id": "4246fcb660e398908bcd3007d9863ef8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/4246fcb660e398908bcd3007d9863ef8",
        "id": "4246fcb660e398908bcd3007d9863ef8",
        "structData": {
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "available_date": "2023-11-14",
          "amenities": [
            "Pet Friendly",
            "Pool",
            "Free Wi-Fi",
            "Bar"
          ],
          "location": {
            "zip_code": "23941",
            "country": "USA",
            "city": "South Amber",
            "state": "NH",
            "address": "2304 Nicholas Fort, Moorechester, MI 20090"
          },
          "id": 262,
          "contact": {
            "email": "eric59@example.com",
            "phone": "316-868-8020x2693"
          },
          "price_per_night": 112.48,
          "title": "Houston-Tran",
          "rating": 1.5
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true"
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.7236669,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.id",
            "value": 262
          },
          {
            "name": "c.rating",
            "value": 1.5
          },
          {
            "name": "c.price_per_night",
            "value": 112.48
          }
        ]
      }
    },
    {
      "id": "d729812e97b224b7a812e9ad0240ca3e",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/d729812e97b224b7a812e9ad0240ca3e",
        "id": "d729812e97b224b7a812e9ad0240ca3e",
        "structData": {
          "location": {
            "address": "38107 Mays Extension Apt. 070, Steventon, DC 31453",
            "state": "MA",
            "country": "USA",
            "zip_code": "25856",
            "city": "New Laura"
          },
          "title": "Serrano, Jackson and Carr",
          "available_date": "2024-04-05",
          "room_types": [
            "Single",
            "Deluxe",
            "Single"
          ],
          "price_per_night": 188.87,
          "contact": {
            "email": "knavarro@example.com",
            "phone": "(089)882-8916"
          },
          "id": 66,
          "rating": 4.3,
          "amenities": [
            "Pet Friendly",
            "Gym",
            "Pool",
            "Free Wi-Fi"
          ]
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0,
          "clearbox_escorer_score": 0.76363050937652588
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.7108109,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.id",
            "value": 66
          },
          {
            "name": "c.rating",
            "value": 4.3
          },
          {
            "name": "c.price_per_night",
            "value": 188.87
          }
        ]
      }
    },
    {
      "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/67e4484d2e6bf30bd3aa5229058cf3ad",
        "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
        "structData": {
          "rating": 4.6,
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "title": "Spencer-Small",
          "id": 249,
          "amenities": [
            "Pet Friendly",
            "Free Wi-Fi",
            "Pet Friendly",
            "Restaurant"
          ],
          "price_per_night": 66.38,
          "contact": {
            "phone": "+1-176-057-5439x71337",
            "email": "mike26@example.com"
          },
          "location": {
            "zip_code": "37354",
            "state": "WY",
            "city": "Port James",
            "address": "52979 Linda Orchard, New Ashley, GA 22405",
            "country": "USA"
          },
          "available_date": "2024-04-10"
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.71184474,
        "boostingFactor": 0,
        "defaultRank": 3,
        "customSignals": [
          {
            "name": "c.id",
            "value": 249
          },
          {
            "name": "c.rating",
            "value": 4.6
          },
          {
            "name": "c.price_per_night",
            "value": 66.38
          }
        ]
      }
    },
    ...
    {
      "id": "53d468f88b0d87b29bff51f8784d91a8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/53d468f88b0d87b29bff51f8784d91a8",
        "id": "53d468f88b0d87b29bff51f8784d91a8",
        "structData": {
          "contact": {
            "email": "bradley29@example.com",
            "phone": "404.120.7687x62482"
          },
          "price_per_night": 68.66,
          "rating": 3.3,
          "amenities": [
            "Restaurant",
            "Bar",
            "Pet Friendly",
            "Pool"
          ],
          "id": 25,
          "room_types": [
            "Suite",
            "Suite",
            "Double"
          ],
          "available_date": "2024-05-15",
          "title": "Wilson-Ward",
          "location": {
            "city": "East Sheila",
            "country": "USA",
            "state": "TX",
            "zip_code": "34921",
            "address": "60458 Fleming Freeway, South Holly, ME 64008"
          }
        },
        "derivedStructData": {
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.70549995,
        "boostingFactor": 0,
        "defaultRank": 49,
        "customSignals": [
          {
            "name": "c.id",
            "value": 25
          },
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.price_per_night",
            "value": 68.66
          }
        ]
      }
    },
    {
      "id": "653c16be81e88e23d694db625e474881",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/653c16be81e88e23d694db625e474881",
        "id": "653c16be81e88e23d694db625e474881",
        "structData": {
          "price_per_night": 443.9,
          "amenities": [
            "Pool",
            "Free Wi-Fi",
            "Parking",
            "Beach Access"
          ],
          "contact": {
            "email": "jamesblackburn@example.com",
            "phone": "155.107.3771"
          },
          "available_date": "2024-02-25",
          "id": 279,
          "room_types": [
            "Deluxe",
            "Penthouse",
            "Single"
          ],
          "title": "Wolf, Williams and Jenkins",
          "rating": 3.1,
          "location": {
            "address": "904 Kimberly Alley, Lake Aprilchester, WI 31242",
            "zip_code": "23652",
            "state": "SD",
            "country": "USA",
            "city": "Cunninghamside"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.76363050937652588,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.69835776,
        "boostingFactor": 0,
        "defaultRank": 50,
        "customSignals": [
          {
            "name": "c.id",
            "value": 279
          },
          {
            "name": "c.rating",
            "value": 3.1
          },
          {
            "name": "c.price_per_night",
            "value": 443.9
          }
        ]
      }
    }
  ],
  "totalSize": 106,
  "attributionToken": "mAL0FwEKDAiJ_4nIBhDH28e5ARIkNjkwMzk4ODktMDAwMC0yNGQ4LWJmYzEtMTRjMTRlZjFiNjcwIgdHRU5FUklDKkiVksUwjr6dFZ_Wty27kfoxvpH6MbaqojKugJM34-uQN9PaiTeQ97IwwvCeFdSynRXg65A3nNa3Lbe3jC2OkckwuaqiMtDaiTcwAVKMAXByb2plY3RzLzc1NjIwNjYwODQ3OS9sb2NhdGlvbnMvZ2xvYmFsL2NvbGxlY3Rpb25zL2RlZmF1bHRfY29sbGVjdGlvbi9lbmdpbmVzL2hvdGVscy1tYW55LXNlYXJjaF8xNzI0NDUyMzYwMzU2L3NlcnZpbmdDb25maWdzL2RlZmF1bHRfc2VhcmNo",
  "nextPageToken": "AzN2IWMmVGNxMGNx0SMjZmYtgDZ0ITLwADMw0CO4gTOzATO2QiGC8O-7WMEGgcmorICMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
    "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {},
  "naturalLanguageQueryUnderstandingInfo": {
    "extractedFilters": "(rating\u003e=4 AND price_per_night\u003c300 AND amenities: ANY(\"Pet Friendly\") AND amenities: ANY(\"Free Wi-Fi\"))",
    "structuredExtractedFilter": {
      "expression": {
        "andExpr": {
          "expressions": [
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Pet Friendly"
                ],
                "querySegment": "lets me bring my dog"
              }
            },
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Free Wi-Fi"
                ],
                "querySegment": "free Wi Fi"
              }
            },
            {
              "numberConstraint": {
                "fieldName": "rating",
                "comparison": "GREATER_THAN_EQUALS",
                "value": 4
              }
            },
            {
              "numberConstraint": {
                "fieldName": "price_per_night",
                "comparison": "LESS_THAN",
                "value": 300
              }
            }
          ]
        }
      }
    }
  }
}

בדוגמה הזו, הפקודה מגדירה את התנהגות המסנן ל-SOFT_BOOST, ומבטלת את ברירת המחדל HARD_FILTER.

ציון שדות לשאילתות בשפה טבעית

כדי להשתמש בשדה כמסנן בהבנת שאילתות בשפה טבעית, צריך לסמן אותו כניתן לאינדוקס בסכימה. (מידע כללי על הצגה ועריכה של סכימה זמין במאמר עדכון סכימה).

חיפוש מבוסס סוכנים קובע אילו מהשדות שאפשר להוסיף לאינדקס בסכימה מתאימים לשימוש במסננים להבנת שאילתות בשפה טבעית. אבל אם נכללים שדות שאתם לא רוצים, אתם צריכים ליצור רשימת היתרים כדי לציין באילו שדות אפשר להשתמש.

אפשר להשתמש באתר להזמנת מלונות, שבו יש שדות כמו amenities,‏ id,‏ price_per_night,‏ rating ו-room_types. אם id היא מחרוזת של תווים ומספרים, סביר להניח ש-חיפוש מבוסס סוכנים לא יכלול אותה בשדות שמשמשים להבנת שאילתות בשפה טבעית.

עם זאת, אם אתם רואים שחיפוש מבוסס סוכנים מחזיר תוצאות באיכות ירודה כי הוא לא מחריג שדות שהוא צריך להחריג, אתם צריכים לציין אילו שדות אפשר להשתמש בהם. לדוגמה, אם בסכימת המלון יש שדה של renovation_status שלא שימושי ללקוחות ועלול לגרום למבוכה לרשת המלונות, אפשר להחריג אותו מרשימת השדות המותרים.

דוגמה לרשומה ממאגר הנתונים המובְנים של נתוני מלונות.

{
  "title": "Miller-Jones",
  "rating": 1.7,
  "price_per_night": 115.16,
  "id": 2902,
    …
  ],
  "amenities": [
    "Spa",
    "Parking",
    "Restaurant"
    …
  ],
  "renovation_status": "Restaurant and spa renovation planned for 2027"
}

רשימת ההיתרים המתאימה לשדות בדוגמה הזו היא ["amenities", "price_per_night", "rating", "title"]. הפריט renovation_status חסר ברשימה.

כדי לציין רשימת היתרים של שדות שאפשר להשתמש בהם בהבנת שאילתות בשפה טבעית בחיפוש, מבצעים את הפעולות הבאות:

REST

מאתרים את מזהה האפליקציה. אם כבר יש לכם מזהה אפליקציה, דלגו לשלב הבא.
1. נכנסים לדף AI Applications במסוף Google Cloud .
  
  מעבר אל 'אפליקציות'
2. בדף אפליקציות, מאתרים את שם האפליקציה ומעתיקים את המזהה שלה מהעמודה מזהה.

מריצים את פקודת ה-curl הבאה, שמפעילה את השיטה search:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["FIELD_1", "FIELD_2"],
    }
  }'

מחליפים את מה שכתוב בשדות הבאים:

‫PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
‫APP_ID: המזהה של אפליקציית החיפוש. האפליקציה צריכה להיות מקושרת למאגר נתונים שמכיל נתונים מובְנים. האפליקציה לא יכולה להיות אפליקציה של חיפוש משולב.
‫QUERY: השאילתה בשפה טבעית.
‫FIELD_N: שדה שאפשר להוסיף לאינדקס בסכימה, שאפשר להשתמש בו כדי להבין שאילתות בשפה טבעית.

דוגמה לפקודה ולתשובה חלקית

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
  -H "Content-Type: application/json"
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
  -d '{
        "query": "A hotel with beach access for less than $150 a night.",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["amenities", "price_per_night", "rating"]
        }
  }'

{
  "results": [
    {
      "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/8dbf32e3e8d289c30a7c70bf4ba68bac",
        "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
        "structData": {
          "rating": 3.2,
          "location": {
            "city": "Jessicastad",
            "country": "USA",
            "zip_code": "18285",
            "state": "IA",
            "address": "552 Martin Gateway Apt. 964, Christinebury, OR 41179"
          },
          "contact": {
            "phone": "001-446-555-2265x7190",
            "email": "edwardscameron@example.com"
          },
          "amenities": [
            "Parking",
            "Beach Access",
            "Spa"
          ],
          "room_types": [
            "Double",
            "Deluxe",
            "Single"
          ],
          "id": 59,
          "title": "Williams, Richmond and Williams",
          "price_per_night": 143,
          "available_date": "2025-06-06"
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0.77886492013931274,
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.71246886,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.2
          },
          {
            "name": "c.id",
            "value": 59
          },
          {
            "name": "c.price_per_night",
            "value": 143
          }
        ]
      }
    },
    ...
    {
      "id": "fd5f0b4125a9c52420510aa1aa52eaff",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/fd5f0b4125a9c52420510aa1aa52eaff",
        "id": "fd5f0b4125a9c52420510aa1aa52eaff",
        "structData": {
          "amenities": [
            "Beach Access",
            "Spa",
            "Gym",
            "Pet Friendly"
          ],
          "room_types": [
            "Queen",
            "King",
            "Suite"
          ],
          "id": 277,
          "title": "Wyatt, Thomas and Price",
          "available_date": "2023-11-17",
          "contact": {
            "phone": "9745551788",
            "email": "shermandaniel@example.com"
          },
          "rating": 3.3,
          "price_per_night": 139.18,
          "location": {
            "address": "05952 Elaine Freeway, Lake Timothychester, MD 69485",
            "country": "USA",
            "state": "DC",
            "city": "North Marcusmouth",
            "zip_code": "23129"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.77886492013931274,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.7304497,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.id",
            "value": 277
          },
          {
            "name": "c.price_per_night",
            "value": 139.18
          }
        ]
      }
    }
  ],
  "totalSize": 17,
  "attributionToken": "lwL0FgEKCwj__drHBhCzzZdSEiQ2OTAwYTgzZC0wMDAwLTI5YzYtYjliMi03NDc0NDYzYjVjY2QiB0dFTkVSSUMqSJWSxTCQ97IwwvCeFZ_Wty25qqIy0NqJN9PaiTeugJM31LKdFY6-nRWc1rct4-uQN7e3jC2-kfoxjpHJMLuR-jG2qqIy4OuQNzABUowBcHJvamVjdHMvNzU2MjA2NjA4NDc5L2xvY2F0aW9ucy9nbG9iYWwvY29sbGVjdGlvbnMvZGVmYXVsdF9jb2xsZWN0aW9uL2VuZ2luZXMvaG90ZWxzLW1hbnktc2VhcmNoXzE3MjQ0NTIzNjA3NTYvc2VydmluZ0NvbmZpZ3MvZGVmYXVsdF9zZWFyY2g",
  "nextPageToken": "Q2YjVjYzYDN0cDN30iMiljYtYzY5ITLwADMw0yYzgTYwATO2QiGB0ZxBPIEGcs6m_PCMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
  "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {}
}

פקודת הדוגמה הזו מאפשרת להשתמש בשדות amenities,‏ price_per_night ו-rating במסנני שאילתות בשפה טבעית.

סינון באמצעות הבנת שפה טבעית קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

מידע על הבנת שאילתות בשפה טבעית

מסננים קשים ורכים

דוגמאות

דוגמה: חילוץ שדות משאילתות (מסנן קשיח)

דוגמה: עם מסנן מיקום גיאוגרפי (מסנן קשיח)

דוגמה: חילוץ שדות משאילתות (מסנן רך)

מגבלות

לפני שמתחילים

REST

דוגמה לפקודה ולתשובה

חיפוש, המרה של שאילתות בשפה טבעית למסננים

REST

דוגמה לפקודה ולתוצאה חלקית

חיפוש, המרה של מיקומים בשאילתות למסנני מיקום גיאוגרפי

REST

דוגמה לפקודה ולתוצאה

חיפוש עם מסנן רך

REST

דוגמה לפקודה ולתשובה חלקית

ציון שדות לשאילתות בשפה טבעית

REST

דוגמה לפקודה ולתשובה חלקית

סינון באמצעות הבנת שפה טבעית