Filtrer avec la compréhension du langage naturel

Cette page explique comment appliquer la compréhension du langage naturel pour créer automatiquement des filtres pour les requêtes de recherche et, ainsi, améliorer la qualité des résultats renvoyés.

Vous pouvez utiliser cette fonctionnalité avec les applications de recherche connectées à des magasins de données structurées.

À propos de la compréhension des requêtes en langage naturel

Si vous disposez d'une application de recherche personnalisée avec des données structurées, les requêtes en langage naturel de vos utilisateurs peuvent être reformatées en requêtes filtrées. Cela peut permettre d'obtenir des résultats de recherche de meilleure qualité que si vous recherchiez des mots dans la chaîne de requête.

Par exemple, une requête en langage naturel telle que "Find a coffee shop serving banana bread" peut être reformulée en requête et en filtre : "query": "banana bread", "filter": "type": ANY(\"cafe\").

L'utilisation de la compréhension des requêtes en langage naturel est plus simple et plus flexible que l'écriture de vos propres expressions de filtre. Pour savoir comment écrire des expressions de filtre, consultez Filtrer la recherche personnalisée pour les données structurées ou non structurées.

Filtres stricts et souples

Il existe deux types de filtres que vous pouvez appliquer pour comprendre les requêtes en langage naturel : stricts et souples.

Difficile Par défaut, les filtres extraits sont appliqués en tant que critères obligatoires auxquels un résultat doit répondre pour être renvoyé.

Le comportement est semblable à celui du champ filter dans la demande de recherche.
Soft Une autre solution que le filtre strict consiste à appliquer un boost aux résultats de recherche. Les résultats boostés sont plus susceptibles d'être renvoyés, mais les résultats qui ne répondent pas au critère de boost peuvent également être renvoyés.

Le comportement est semblable à celui du champ boostSpec dans la demande de recherche.

Vous pouvez tester les deux types de filtres. Si les recherches ne renvoient pas assez de résultats, essayez le filtre souple au lieu du filtre strict.

Pour savoir comment appliquer un filtre flou, consultez Effectuer une recherche avec le filtre flou ci-dessous.

Exemples

Cette fonctionnalité est plus facile à comprendre à l'aide d'exemples :

Exemple : Extraction de champs à partir de requêtes (filtre strict) montre les filtres de champ extraits de la requête.
Exemple : Avec un filtre de géolocalisation (filtre strict) inclut le cas particulier du filtre de géolocalisation.
L'exemple d'extraction de champ à partir de requêtes (filtre souple) montre le filtre souple extrait d'une requête envoyée à une application combinée.

Exemple : Extraction de champs à partir de requêtes (filtre strict)

Cette fonctionnalité de compréhension des requêtes en langage naturel est expliquée à travers l'exemple de la recherche d'un hôtel.

Prenons l'exemple d'une requête envoyée à un magasin de données structurées pour un site d'hôtel : "Trouve-moi un hôtel adapté aux familles, avec au moins quatre étoiles, qui coûte moins de 300 € par nuit, qui accepte les chiens et qui propose le Wi-Fi gratuit."

Sans compréhension des requêtes en langage naturel, l'application de recherche recherche les documents contenant les mots de la requête.

Grâce à la compréhension des requêtes en langage naturel et à des données structurées de manière appropriée, la recherche est plus efficace, car certains éléments en langage naturel de la requête sont remplacés par des filtres. Si les données structurées comportent des champs pour star_rating (nombres), price (nombres) et amenities (chaînes), la requête peut être formulée pour inclure les filtres suivants :

   {
       "star_rating": >=4,
       "price": <=300,
       "amenities": "Wifi", "Pets Allowed"
   }

Exemple : Avec un filtre de géolocalisation (filtre strict)

Cet exemple est semblable au précédent, sauf qu'il inclut un filtre geolocation, qui est un type spécial de filtre extrait. Vertex AI Search peut reconnaître les lieux dans une requête et créer des filtres de proximité pour ces lieux.

Prenons l'exemple de la requête suivante effectuée sur un site d'entreprises à l'échelle de l'État : "Trouve-moi un hôtel chic et élégant avec au moins 4 étoiles à San Francisco."

Grâce à la compréhension des requêtes en langage naturel et au filtre de géolocalisation, la recherche est reformulée pour inclure le filtre suivant pour un hôtel avec une note d'au moins 4 étoiles et situé dans un rayon de 10 km autour de San Francisco :

   {
       "star_rating": >=4,
       "location": GEO_DISTANCE(\"San Francisco, CA\", 10000)
   }

Dans cet exemple, GEO_DISTANCE est une adresse, mais dans d'autres requêtes, elle peut être écrite sous la forme d'une latitude et d'une longitude, même si la requête d'origine contenait une adresse.

Exemple : Extraction de champs à partir de requêtes (filtre souple)

Cette fonctionnalité de compréhension des requêtes en langage naturel est expliquée à travers l'exemple d'une recherche d'hôtel qui affiche des résultats ne répondant pas à tous les critères.

Prenons l'exemple de la requête suivante effectuée sur un site de voyage : "Trouve-moi un hôtel adapté aux familles avec au moins quatre étoiles, qui coûte moins de 300 € par nuit et qui accepte les chiens."

Grâce à la compréhension des requêtes en langage naturel et à des données structurées de manière appropriée, la recherche est plus efficace, car certains éléments en langage naturel de la requête sont remplacés par des filtres souples. Si les données structurées comportent des champs pour star_rating (nombres), price (nombres) et amenities (chaînes), la requête peut être réécrite comme suit :

Condition de boost extraite de la requête en langage naturel :

{
  "boostSpec": {
    "conditionBoostSpecs": {
      "condition": "(star_rating >= 4.5) AND (price < 200) AND ANY(amenities, \"Pets Allowed\")",
      "boost": 0.7
    }
  }
}

Dans ce cas, il est possible que des hôtels moins bien notés ou qui n'acceptent pas les animaux soient proposés.

L'ampleur de l'optimisation dépend du nombre de filtres structurés auxquels correspond un document. Si trois conditions sont extraites et que le document ne correspond qu'à l'une d'elles, il bénéficie d'un léger boost. En revanche, si le document remplit les trois conditions, il bénéficie d'un fort boost.

Limites

Les limites suivantes s'appliquent à la compréhension des requêtes en langage naturel :

La compréhension des requêtes en langage naturel ne peut pas être appliquée aux applications de recherche combinée. Une erreur s'affiche si vous essayez d'utiliser la compréhension des requêtes en langage naturel avec une application de recherche combinée.
La compréhension des requêtes en langage naturel ne fonctionne que pour les applications de recherche personnalisées qui utilisent des magasins de données structurées.
L'utilisation de la compréhension des requêtes en langage naturel augmente la latence. Vous pouvez donc choisir de ne pas l'utiliser si la latence pose problème.
Pour la géolocalisation, l'emplacement doit être décrit explicitement. Vous ne pouvez pas utiliser des lieux tels que "à proximité" ou "domicile".
Le rayon de la géolocalisation est de 10 km et n'est pas configurable.
Les champs booléens ne peuvent pas être utilisés dans les filtres. Par exemple, si la requête est "Trouve-moi une chambre d'hôtel non-fumeur", un champ booléen tel que "non_smoking": true n'est pas utile, mais un champ de chaîne tel que "non_smoking": "YES" peut faire partie du filtre.

Avant de commencer

Avant de commencer à utiliser la compréhension des requêtes en langage naturel, vous devez l'activer pour les magasins de données structurées connectés aux applications que vous prévoyez d'utiliser.

Pour activer la compréhension des requêtes en langage naturel, procédez comme suit :

REST

Trouvez l'ID de votre data store. Si vous disposez déjà de l'ID de votre data store, passez à l'étape suivante.
1. Dans la console Google Cloud , accédez à la page Applications d'IA, puis cliquez sur Data stores dans le menu de navigation.
  
  Accéder à la page "Data stores"
2. Cliquez sur le nom de votre data store.
3. Sur la page Données de votre data store, obtenez l'ID du data store.

Exécutez la commande curl suivante :

curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID?update_mask=natural_language_query_understanding_config.mode" \
-d '{
      "naturalLanguageQueryUnderstandingConfig": {
        "mode": "ENABLED"
      }
    }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre projet Google Cloud .
DATA_STORE_ID : ID du data store Vertex AI Search.

Exemple de commande et de réponse

curl -X PATCH
-H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
-H "X-Goog-User-Project: my-project-123"
"https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store?update_mask=natural_language_query_understanding_config.mode"
-d '{
       "naturalLanguageQueryUnderstandingConfig": {
         "mode": "ENABLED"
       }
    }'

{
  "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store",
  "displayName": "test_data_store",
  "industryVertical": "GENERIC",
  "createTime": "2024-07-10T18:50:01.673414Z",
  "solutionTypes": [
    "SOLUTION_TYPE_SEARCH"
  ],
  "defaultSchemaId": "default_schema",
  "documentProcessingConfig": {
    "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store/documentProcessingConfig",
    "defaultParsingConfig": {
      "digitalParsingConfig": {}
    }
  },
  "servingConfigDataStore": {},
  "naturalLanguageQueryUnderstandingConfig": {
    "mode": "ENABLED"
  }
}

Répétez les étapes 1 et 2 pour chaque dépôt de données.
Patientez environ 24 heures.

Si vous essayez d'utiliser la compréhension des requêtes en langage naturel avant que le data store ne soit prêt, la réponse que vous obtenez est la même que si filterExtractionCondition était défini sur DISABLED.

Rechercher en convertissant les requêtes en langage naturel en filtres

Pour effectuer une recherche à l'aide d'une requête en langage naturel et obtenir des résultats optimisés pour ce type de requête, procédez comme suit :

REST

Exécutez la commande curl suivante, qui appelle la méthode search :

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED"
        }
      }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre projet Google Cloud .
APP_ID : ID de l'application Vertex AI Search que vous souhaitez interroger. L'application doit être associée à un data store contenant des données structurées. L'application ne peut pas être une application de recherche combinée.
QUERY : requête rédigée en langage naturel.

Exemple de commande et résultat partiel

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED"}
}'

{
"results": [
{
  "id": "b2617d862",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
    ...
  }
},
{
  "id": "a51841841",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
    ...
  }
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(amenities: ANY(\"Pets Allowed\") AND amenities: ANY(\"Wifi\") AND star_rating: >= 4 AND price: < 300)",
"extractedFilterStructured": {
  "expression": {
    "andExpr": {
      "expressions": [
        {
          "numberConstraint": {
            "fieldName": "star_rating",
            "value": 4,
            "comparison": "GREATER_THAN_EQUALS",
          }
        },
        {
          "numberConstraint": {
            "fieldName": "price",
            "value": 300,
            "comparison": "LESS_THAN",
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Pets Allowed"]
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Wifi"]
          }
        },
      ]
    }

Recherche, conversion des lieux dans les requêtes en filtres de géolocalisation

Pour rechercher une requête en langage naturel et obtenir des résultats optimisés pour les requêtes en langage naturel, y compris la proximité des lieux, procédez comme suit :

REST

Exécutez la commande curl suivante, qui appelle la méthode search :

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "geoSearchQueryDetectionFieldNames": ["GEO_FIELD_NAME_1", "GEO_FIELD_NAME_N"]"
        }
      }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre projet Google Cloud .
APP_ID : ID de l'application Vertex AI Search que vous souhaitez interroger. L'application doit être associée à un data store contenant des données structurées. L'application ne peut pas être une application de recherche combinée.
QUERY : requête rédigée en langage naturel.
GEO_FIELD_NAME_1, GEO_FIELD_NAME_N : liste de valeurs de type geolocation. Si le type de valeur n'est pas geolocation, ce champ est ignoré.

Exemple de commande et résultat

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a chic and stylish hotel with at least 4 stars that is in San Francisco.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED",
  "geoSearchQueryDetectionFieldNames": ["location"]}
}'

{
"results": [
{
"id": "b2617d862",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
...
}
},
{
"id": "a51841841",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
...
}
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(star_rating: >= 4 AND GEO_DISTANCE("location", "San Francisco", 10000))",
"extractedFilterStructured": {
"expression": {
"andExpr": {
  "expressions": [
    {
      "numberConstraint": {
        "fieldName": "star_rating",
        "value": 4,
        "comparison": "GREATER_THAN_EQUALS",
      }
    },
    {
      "geolocationConstraint": {
        "fieldName": "location",
        "address": "San Francisco",
        "radius_in_meters": 10000,
      }
    },
  ]
}

Rechercher avec le filtre "Doux"

Pour appliquer un filtre léger :

REST

Trouvez l'ID de votre application. Si vous avez déjà votre ID d'application, passez à l'étape suivante.
1. Dans la console Google Cloud , accédez à la page Applications d'IA.
  
  Accédez à "Applications".
2. Sur la page Applications, recherchez le nom de votre application et récupérez son ID dans la colonne ID.

Exécutez la commande curl suivante, qui appelle la méthode search :

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre projet Google Cloud .
APP_ID : ID de votre application de recherche. L'application doit être connectée à un data store contenant des données structurées. L'application ne peut pas être une application de recherche mixte.
QUERY : votre requête en langage naturel.

Exemple de commande et de réponse partielle

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search" \
  -d '{
        "query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

{
  "results": [
    {
      "id": "4246fcb660e398908bcd3007d9863ef8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/4246fcb660e398908bcd3007d9863ef8",
        "id": "4246fcb660e398908bcd3007d9863ef8",
        "structData": {
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "available_date": "2023-11-14",
          "amenities": [
            "Pet Friendly",
            "Pool",
            "Free Wi-Fi",
            "Bar"
          ],
          "location": {
            "zip_code": "23941",
            "country": "USA",
            "city": "South Amber",
            "state": "NH",
            "address": "2304 Nicholas Fort, Moorechester, MI 20090"
          },
          "id": 262,
          "contact": {
            "email": "eric59@example.com",
            "phone": "316-868-8020x2693"
          },
          "price_per_night": 112.48,
          "title": "Houston-Tran",
          "rating": 1.5
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true"
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.7236669,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.id",
            "value": 262
          },
          {
            "name": "c.rating",
            "value": 1.5
          },
          {
            "name": "c.price_per_night",
            "value": 112.48
          }
        ]
      }
    },
    {
      "id": "d729812e97b224b7a812e9ad0240ca3e",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/d729812e97b224b7a812e9ad0240ca3e",
        "id": "d729812e97b224b7a812e9ad0240ca3e",
        "structData": {
          "location": {
            "address": "38107 Mays Extension Apt. 070, Steventon, DC 31453",
            "state": "MA",
            "country": "USA",
            "zip_code": "25856",
            "city": "New Laura"
          },
          "title": "Serrano, Jackson and Carr",
          "available_date": "2024-04-05",
          "room_types": [
            "Single",
            "Deluxe",
            "Single"
          ],
          "price_per_night": 188.87,
          "contact": {
            "email": "knavarro@example.com",
            "phone": "(089)882-8916"
          },
          "id": 66,
          "rating": 4.3,
          "amenities": [
            "Pet Friendly",
            "Gym",
            "Pool",
            "Free Wi-Fi"
          ]
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0,
          "clearbox_escorer_score": 0.76363050937652588
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.7108109,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.id",
            "value": 66
          },
          {
            "name": "c.rating",
            "value": 4.3
          },
          {
            "name": "c.price_per_night",
            "value": 188.87
          }
        ]
      }
    },
    {
      "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/67e4484d2e6bf30bd3aa5229058cf3ad",
        "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
        "structData": {
          "rating": 4.6,
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "title": "Spencer-Small",
          "id": 249,
          "amenities": [
            "Pet Friendly",
            "Free Wi-Fi",
            "Pet Friendly",
            "Restaurant"
          ],
          "price_per_night": 66.38,
          "contact": {
            "phone": "+1-176-057-5439x71337",
            "email": "mike26@example.com"
          },
          "location": {
            "zip_code": "37354",
            "state": "WY",
            "city": "Port James",
            "address": "52979 Linda Orchard, New Ashley, GA 22405",
            "country": "USA"
          },
          "available_date": "2024-04-10"
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.71184474,
        "boostingFactor": 0,
        "defaultRank": 3,
        "customSignals": [
          {
            "name": "c.id",
            "value": 249
          },
          {
            "name": "c.rating",
            "value": 4.6
          },
          {
            "name": "c.price_per_night",
            "value": 66.38
          }
        ]
      }
    },
    ...
    {
      "id": "53d468f88b0d87b29bff51f8784d91a8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/53d468f88b0d87b29bff51f8784d91a8",
        "id": "53d468f88b0d87b29bff51f8784d91a8",
        "structData": {
          "contact": {
            "email": "bradley29@example.com",
            "phone": "404.120.7687x62482"
          },
          "price_per_night": 68.66,
          "rating": 3.3,
          "amenities": [
            "Restaurant",
            "Bar",
            "Pet Friendly",
            "Pool"
          ],
          "id": 25,
          "room_types": [
            "Suite",
            "Suite",
            "Double"
          ],
          "available_date": "2024-05-15",
          "title": "Wilson-Ward",
          "location": {
            "city": "East Sheila",
            "country": "USA",
            "state": "TX",
            "zip_code": "34921",
            "address": "60458 Fleming Freeway, South Holly, ME 64008"
          }
        },
        "derivedStructData": {
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.70549995,
        "boostingFactor": 0,
        "defaultRank": 49,
        "customSignals": [
          {
            "name": "c.id",
            "value": 25
          },
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.price_per_night",
            "value": 68.66
          }
        ]
      }
    },
    {
      "id": "653c16be81e88e23d694db625e474881",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/653c16be81e88e23d694db625e474881",
        "id": "653c16be81e88e23d694db625e474881",
        "structData": {
          "price_per_night": 443.9,
          "amenities": [
            "Pool",
            "Free Wi-Fi",
            "Parking",
            "Beach Access"
          ],
          "contact": {
            "email": "jamesblackburn@example.com",
            "phone": "155.107.3771"
          },
          "available_date": "2024-02-25",
          "id": 279,
          "room_types": [
            "Deluxe",
            "Penthouse",
            "Single"
          ],
          "title": "Wolf, Williams and Jenkins",
          "rating": 3.1,
          "location": {
            "address": "904 Kimberly Alley, Lake Aprilchester, WI 31242",
            "zip_code": "23652",
            "state": "SD",
            "country": "USA",
            "city": "Cunninghamside"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.76363050937652588,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.69835776,
        "boostingFactor": 0,
        "defaultRank": 50,
        "customSignals": [
          {
            "name": "c.id",
            "value": 279
          },
          {
            "name": "c.rating",
            "value": 3.1
          },
          {
            "name": "c.price_per_night",
            "value": 443.9
          }
        ]
      }
    }
  ],
  "totalSize": 106,
  "attributionToken": "mAL0FwEKDAiJ_4nIBhDH28e5ARIkNjkwMzk4ODktMDAwMC0yNGQ4LWJmYzEtMTRjMTRlZjFiNjcwIgdHRU5FUklDKkiVksUwjr6dFZ_Wty27kfoxvpH6MbaqojKugJM34-uQN9PaiTeQ97IwwvCeFdSynRXg65A3nNa3Lbe3jC2OkckwuaqiMtDaiTcwAVKMAXByb2plY3RzLzc1NjIwNjYwODQ3OS9sb2NhdGlvbnMvZ2xvYmFsL2NvbGxlY3Rpb25zL2RlZmF1bHRfY29sbGVjdGlvbi9lbmdpbmVzL2hvdGVscy1tYW55LXNlYXJjaF8xNzI0NDUyMzYwMzU2L3NlcnZpbmdDb25maWdzL2RlZmF1bHRfc2VhcmNo",
  "nextPageToken": "AzN2IWMmVGNxMGNx0SMjZmYtgDZ0ITLwADMw0CO4gTOzATO2QiGC8O-7WMEGgcmorICMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
    "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {},
  "naturalLanguageQueryUnderstandingInfo": {
    "extractedFilters": "(rating\u003e=4 AND price_per_night\u003c300 AND amenities: ANY(\"Pet Friendly\") AND amenities: ANY(\"Free Wi-Fi\"))",
    "structuredExtractedFilter": {
      "expression": {
        "andExpr": {
          "expressions": [
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Pet Friendly"
                ],
                "querySegment": "lets me bring my dog"
              }
            },
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Free Wi-Fi"
                ],
                "querySegment": "free Wi Fi"
              }
            },
            {
              "numberConstraint": {
                "fieldName": "rating",
                "comparison": "GREATER_THAN_EQUALS",
                "value": 4
              }
            },
            {
              "numberConstraint": {
                "fieldName": "price_per_night",
                "comparison": "LESS_THAN",
                "value": 300
              }
            }
          ]
        }
      }
    }
  }
}

Cet exemple de commande définit le comportement du filtre sur SOFT_BOOST, en remplaçant la valeur par défaut HARD_FILTER.

Spécifier des champs pour les requêtes en langage naturel

Pour qu'un champ puisse être utilisé comme filtre dans la compréhension des requêtes en langage naturel, il doit être marqué comme indexable dans le schéma. (Pour obtenir des informations générales sur l'affichage et la modification d'un schéma, consultez Mettre à jour un schéma.)

Vertex AI Search détermine quels champs indexables du schéma peuvent être utilisés dans les filtres de compréhension des requêtes en langage naturel. Toutefois, si des champs que vous ne souhaitez pas voir apparaître sont inclus, vous devez créer une liste d'autorisation pour spécifier les champs qui peuvent être utilisés.

Prenons l'exemple d'un site de réservation d'hôtels, où l'on trouve des champs tels que amenities, id, price_per_night, rating et room_types. Si le id est une chaîne de caractères et de chiffres, Vertex AI Search est susceptible de l'exclure des champs utilisés pour comprendre les requêtes en langage naturel.

Toutefois, si vous constatez que Vertex AI Search renvoie des résultats de requête de mauvaise qualité, car il n'exclut pas les champs qu'il devrait, vous devez spécifier les champs qui peuvent être utilisés. Par exemple, si le schéma d'hôtel comporte un champ renovation_status qui n'est pas utile aux clients et qui pourrait être embarrassant pour la chaîne hôtelière, vous pouvez l'exclure de la liste des champs autorisés.

Exemple d'enregistrement provenant du magasin de données structurées de données d'hôtel.

{
  "title": "Miller-Jones",
  "rating": 1.7,
  "price_per_night": 115.16,
  "id": 2902,
    …
  ],
  "amenities": [
    "Spa",
    "Parking",
    "Restaurant"
    …
  ],
  "renovation_status": "Restaurant and spa renovation planned for 2027"
}

Une liste d'autorisation appropriée pour les champs de cet exemple serait ["amenities", "price_per_night", "rating", "title"]. renovation_status ne figure pas dans la liste.

Pour spécifier une liste d'autorisation des champs pouvant être utilisés dans une requête en langage naturel pour comprendre une recherche, procédez comme suit :

REST

Trouvez l'ID de votre application. Si vous avez déjà votre ID d'application, passez à l'étape suivante.
1. Dans la console Google Cloud , accédez à la page Applications d'IA.
  
  Accédez à "Applications".
2. Sur la page Applications, recherchez le nom de votre application et récupérez son ID dans la colonne ID.

Exécutez la commande curl suivante, qui appelle la méthode search :

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["FIELD_1", "FIELD_2"],
    }
  }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre projet Google Cloud .
APP_ID : ID de votre application de recherche. L'application doit être connectée à un data store contenant des données structurées. L'application ne peut pas être une application de recherche mixte.
QUERY : votre requête en langage naturel.
FIELD_N : champ indexable dans le schéma qui peut être utilisé pour comprendre les requêtes en langage naturel.

Exemple de commande et de réponse partielle

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
  -H "Content-Type: application/json"
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
  -d '{
        "query": "A hotel with beach access for less than $150 a night.",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["amenities", "price_per_night", "rating"]
        }
  }'

{
  "results": [
    {
      "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/8dbf32e3e8d289c30a7c70bf4ba68bac",
        "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
        "structData": {
          "rating": 3.2,
          "location": {
            "city": "Jessicastad",
            "country": "USA",
            "zip_code": "18285",
            "state": "IA",
            "address": "552 Martin Gateway Apt. 964, Christinebury, OR 41179"
          },
          "contact": {
            "phone": "001-446-555-2265x7190",
            "email": "edwardscameron@example.com"
          },
          "amenities": [
            "Parking",
            "Beach Access",
            "Spa"
          ],
          "room_types": [
            "Double",
            "Deluxe",
            "Single"
          ],
          "id": 59,
          "title": "Williams, Richmond and Williams",
          "price_per_night": 143,
          "available_date": "2025-06-06"
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0.77886492013931274,
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.71246886,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.2
          },
          {
            "name": "c.id",
            "value": 59
          },
          {
            "name": "c.price_per_night",
            "value": 143
          }
        ]
      }
    },
    ...
    {
      "id": "fd5f0b4125a9c52420510aa1aa52eaff",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/fd5f0b4125a9c52420510aa1aa52eaff",
        "id": "fd5f0b4125a9c52420510aa1aa52eaff",
        "structData": {
          "amenities": [
            "Beach Access",
            "Spa",
            "Gym",
            "Pet Friendly"
          ],
          "room_types": [
            "Queen",
            "King",
            "Suite"
          ],
          "id": 277,
          "title": "Wyatt, Thomas and Price",
          "available_date": "2023-11-17",
          "contact": {
            "phone": "9745551788",
            "email": "shermandaniel@example.com"
          },
          "rating": 3.3,
          "price_per_night": 139.18,
          "location": {
            "address": "05952 Elaine Freeway, Lake Timothychester, MD 69485",
            "country": "USA",
            "state": "DC",
            "city": "North Marcusmouth",
            "zip_code": "23129"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.77886492013931274,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.7304497,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.id",
            "value": 277
          },
          {
            "name": "c.price_per_night",
            "value": 139.18
          }
        ]
      }
    }
  ],
  "totalSize": 17,
  "attributionToken": "lwL0FgEKCwj__drHBhCzzZdSEiQ2OTAwYTgzZC0wMDAwLTI5YzYtYjliMi03NDc0NDYzYjVjY2QiB0dFTkVSSUMqSJWSxTCQ97IwwvCeFZ_Wty25qqIy0NqJN9PaiTeugJM31LKdFY6-nRWc1rct4-uQN7e3jC2-kfoxjpHJMLuR-jG2qqIy4OuQNzABUowBcHJvamVjdHMvNzU2MjA2NjA4NDc5L2xvY2F0aW9ucy9nbG9iYWwvY29sbGVjdGlvbnMvZGVmYXVsdF9jb2xsZWN0aW9uL2VuZ2luZXMvaG90ZWxzLW1hbnktc2VhcmNoXzE3MjQ0NTIzNjA3NTYvc2VydmluZ0NvbmZpZ3MvZGVmYXVsdF9zZWFyY2g",
  "nextPageToken": "Q2YjVjYzYDN0cDN30iMiljYtYzY5ITLwADMw0yYzgTYwATO2QiGB0ZxBPIEGcs6m_PCMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
  "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {}
}

Cet exemple de commande permet d'utiliser les champs amenities, price_per_night et rating dans les filtres de requête en langage naturel.

Filtrer avec la compréhension du langage naturel Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

À propos de la compréhension des requêtes en langage naturel

Filtres stricts et souples

Exemples

Exemple : Extraction de champs à partir de requêtes (filtre strict)

Exemple : Avec un filtre de géolocalisation (filtre strict)

Exemple : Extraction de champs à partir de requêtes (filtre souple)

Limites

Avant de commencer

REST

Exemple de commande et de réponse

Rechercher en convertissant les requêtes en langage naturel en filtres

REST

Exemple de commande et résultat partiel

Recherche, conversion des lieux dans les requêtes en filtres de géolocalisation

REST

Exemple de commande et résultat

Rechercher avec le filtre "Doux"

REST

Exemple de commande et de réponse partielle

Spécifier des champs pour les requêtes en langage naturel

REST

Exemple de commande et de réponse partielle

Filtrer avec la compréhension du langage naturel