Cette page a été traduite par l'API Cloud Translation.

Filtrer avec la compréhension du langage naturel

Cette page explique comment appliquer la compréhension du langage naturel pour créer automatiquement des filtres pour les requêtes de recherche et, par conséquent, améliorer la qualité des résultats renvoyés.

Vous pouvez utiliser cette fonctionnalité avec des applications de recherche connectées à des data stores structurés.

À propos de la compréhension des requêtes en langage naturel

Si vous disposez d'une application de recherche personnalisée avec des données structurées, les requêtes en langage naturel de vos utilisateurs peuvent être reformulées en requêtes filtrées queries. Cela peut améliorer la qualité des résultats de recherche par rapport à la recherche de mots dans la chaîne de requête.

Par exemple, une requête en langage naturel telle que "Find a coffee shop serving banana bread" peut être reformulée en requête et en filtre: "query": "banana bread", "filter": "type": ANY(\"cafe\").

L'utilisation de la compréhension des requêtes en langage naturel est plus simple et plus flexible que l'écriture de vos propres expressions de filtre. Pour en savoir plus sur l'écriture d'expressions de filtre, consultez Filtrer la recherche personnalisée pour les données structurées ou non structurées.

Filtres stricts et filtres souples

Vous pouvez appliquer deux types de filtres pour la compréhension des requêtes en langage naturel : strict et souple.

Strict. Par défaut, les filtres extraits sont appliqués en tant que critères obligatoires auxquels un résultat doit répondre pour être renvoyé.

Le comportement est semblable à celui du champ filter dans le SearchRequest message.
Souple. Une alternative au filtre strict consiste à appliquer un boost aux résultats de recherche. Les résultats boostés sont plus susceptibles d'être renvoyés, mais les résultats qui ne répondent pas au critère de boost peuvent également être renvoyés.

Le comportement est semblable à celui du champ boost_spec dans le SearchRequest message.

Vous pouvez tester les deux types de filtres. Si les recherches ne renvoient pas suffisamment de résultats, essayez le filtre souple au lieu du filtre strict.

Pour savoir comment appliquer un filtre souple, consultez la section Rechercher avec le filtre souple ci-dessous.

Exemples

Cette fonctionnalité est mieux expliquée à l'aide d'exemples :

Exemple : Extraction de champs à partir de requêtes (filtre strict) affiche les filtres de champ extraits de la requête.
Exemple : Avec un filtre de géolocalisation (filtre strict) inclut le cas particulier du filtre de géolocalisation.
Exemple : Extraction de champs à partir de requêtes (filtre souple) affiche le filtre souple extrait d'une requête adressée à une application combinée.

Exemple : Extraction de champs à partir de requêtes (filtre strict)

Cette fonctionnalité de compréhension des requêtes en langage naturel est expliquée à l'aide de l'exemple de recherche d'un hôtel.

Prenons la requête suivante adressée à un data store structuré pour un site d’hôtel : "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi."

Sans la compréhension des requêtes en langage naturel, l'application de recherche recherche les documents contenant les mots de la requête.

Grâce à la compréhension des requêtes en langage naturel et à des données correctement structurées, la recherche est rendue plus efficace en remplaçant une partie du langage naturel de la requête par des filtres. Si les données structurées comportent des champs pour star_rating (nombres), price (nombres) et amenities (chaînes), la requête peut être formulée pour inclure les filtres suivants :

   {
       "star_rating": >=4,
       "price": <=300,
       "amenities": "Wifi", "Pets Allowed"
   }

Exemple : Avec un filtre de géolocalisation (filtre strict)

Cet exemple est semblable au précédent, à ceci près qu'il inclut un filtre de géolocalisation, qui est un type spécial de filtre extrait. Vertex AI Search est capable de reconnaître des lieux dans une requête et de créer des filtres de proximité pour ces lieux.

Prenons la requête suivante adressée à un site d'entreprise à l'échelle de l'État : « Find me a chic and stylish hotel with at least 4 stars that is in San Francisco. »

Grâce à la compréhension des requêtes en langage naturel et au filtre de géolocalisation, la recherche est reformulée pour inclure le filtre suivant pour un hôtel avec au moins 4 étoiles et situé dans un rayon de 10 km de San Francisco :

   {
       "star_rating": >=4,
       "location": GEO_DISTANCE(\"San Francisco, CA\", 10000)
   }

Dans cet exemple, GEO_DISTANCE est une adresse, mais dans d'autres requêtes, elle peut être écrite sous forme de latitude et de longitude, même si la requête d'origine contenait une adresse.

Exemple : Extraction de champs à partir de requêtes (filtre souple)

Cette fonctionnalité de compréhension des requêtes en langage naturel est expliquée à l'aide de l'exemple de recherche d'un hôtel, mais en affichant certains résultats qui ne répondent pas à tous les critères.

Prenons la requête suivante adressée à un site de voyage: "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, and lets me bring my dog."

Grâce à la compréhension des requêtes en langage naturel et à des données correctement structurées, la recherche est plus efficace en remplaçant une partie du langage naturel de la requête par des filtres souples. Si les données structurées comportent des champs pour star_rating (nombres), price (nombres) et amenities (chaînes), la requête peut être réécrite comme suit :

Condition de boost extraite de la requête en langage naturel :

{
  "boostSpec": {
    "conditionBoostSpecs": {
      "condition": "(star_rating >= 4.5) AND (price < 200) AND ANY(amenities, \"Pets Allowed\")",
      "boost": 0.7
    }
  }
}

Dans ce cas, certains hôtels moins bien notés ou qui n'acceptent pas les animaux peuvent être renvoyés.

La force du boost dépend du nombre de filtres structurés auxquels un document correspond. Si trois conditions sont extraites et que le document ne correspond qu'à l'une d'elles, il reçoit un petit boost. En revanche, si le document correspond aux trois conditions, il reçoit un boost important.

Limites

Les limites suivantes s'appliquent à la compréhension des requêtes en langage naturel :

La compréhension des requêtes en langage naturel ne peut pas être appliquée aux applications de recherche combinées. Une erreur s'affiche si vous essayez d'utiliser la compréhension des requêtes en langage naturel avec une application de recherche combinée.
La compréhension des requêtes en langage naturel ne fonctionne que pour les applications de recherche personnalisées qui utilisent des data stores structurés.
L'utilisation de la compréhension des requêtes en langage naturel augmente la latence. Vous pouvez donc choisir de ne pas l'utiliser si la latence est un problème.
Pour la géolocalisation, le lieu doit être décrit explicitement. Vous ne pouvez pas utiliser des lieux tels que "près de moi" ou "chez moi".
Le rayon de géolocalisation est de 10 km et n'est pas configurable.
Les champs booléens ne peuvent pas être utilisés dans les filtres. Par exemple, si la requête est "Find me a non-smoking hotel room", un champ booléen tel que "non_smoking": true n'est pas utile, mais un champ de chaîne tel que "non_smoking": "YES" peut faire partie du filtre.

Avant de commencer

Avant de commencer à utiliser la compréhension des requêtes en langage naturel, vous devez l'activer pour les data stores structurés connectés aux applications que vous prévoyez d'utiliser.

Pour activer la compréhension des requêtes en langage naturel, procédez comme suit :

REST

Recherchez l'ID de votre data store. Si vous disposez déjà de l'ID de votre data store, passez à l'étape suivante.
1. Dans la Google Cloud console, accédez à la page Applications d'IA, puis cliquez sur Data stores dans le menu de navigation.
  
  Accéder à la page "Data stores"
2. Cliquez sur le nom de votre data store.
3. Sur la page Données de votre data store, obtenez l'ID du data store.

Exécutez la commande curl suivante :

curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID?update_mask=natural_language_query_understanding_config.mode" \
-d '{
      "naturalLanguageQueryUnderstandingConfig": {
        "mode": "ENABLED"
      }
    }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre Google Cloud projet.
DATA_STORE_ID : ID du data store Vertex AI Search.

Exemple de commande et de réponse

curl -X PATCH
-H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
-H "X-Goog-User-Project: my-project-123"
"https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store?update_mask=natural_language_query_understanding_config.mode"
-d '{
       "naturalLanguageQueryUnderstandingConfig": {
         "mode": "ENABLED"
       }
    }'

{
  "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store",
  "displayName": "test_data_store",
  "industryVertical": "GENERIC",
  "createTime": "2024-07-10T18:50:01.673414Z",
  "solutionTypes": [
    "SOLUTION_TYPE_SEARCH"
  ],
  "defaultSchemaId": "default_schema",
  "documentProcessingConfig": {
    "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store/documentProcessingConfig",
    "defaultParsingConfig": {
      "digitalParsingConfig": {}
    }
  },
  "servingConfigDataStore": {},
  "naturalLanguageQueryUnderstandingConfig": {
    "mode": "ENABLED"
  }
}

Répétez les étapes 1 et 2 pour chaque data store.
Attendez environ 24 heures.

Si vous essayez d'utiliser la compréhension des requêtes en langage naturel avant que le data store ne soit prêt, la réponse que vous obtenez est la même que si filterExtractionCondition était défini sur DISABLED.

Rechercher en convertissant les requêtes en langage naturel en filtres

Pour effectuer une recherche sur une requête en langage naturel et obtenir des résultats optimisés pour les requêtes en langage naturel, procédez comme suit :

REST

Exécutez la commande curl suivante, qui appelle la search méthode :

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED"
        }
      }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre Google Cloud projet.
APP_ID : ID de l'application Vertex AI Search que vous souhaitez interroger. L'application doit être connectée à un data store contenant des données structurées. L'application ne peut pas être une application de recherche combinée.
QUERY : requête écrite en langage naturel.

Exemple de commande et résultat partiel

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED"}
}'

{
"results": [
{
  "id": "b2617d862",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
    ...
  }
},
{
  "id": "a51841841",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
    ...
  }
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(amenities: ANY(\"Pets Allowed\") AND amenities: ANY(\"Wifi\") AND star_rating: >= 4 AND price: < 300)",
"extractedFilterStructured": {
  "expression": {
    "andExpr": {
      "expressions": [
        {
          "numberConstraint": {
            "fieldName": "star_rating",
            "value": 4,
            "comparison": "GREATER_THAN_EQUALS",
          }
        },
        {
          "numberConstraint": {
            "fieldName": "price",
            "value": 300,
            "comparison": "LESS_THAN",
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Pets Allowed"]
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Wifi"]
          }
        },
      ]
    }

Rechercher en convertissant les lieux des requêtes en filtres de géolocalisation

Pour effectuer une recherche sur une requête en langage naturel et obtenir des résultats optimisés pour les requêtes en langage naturel, y compris la proximité des lieux, procédez comme suit :

REST

Exécutez la commande curl suivante, qui appelle la search méthode :

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "geoSearchQueryDetectionFieldNames": ["GEO_FIELD_NAME_1", "GEO_FIELD_NAME_N"]"
        }
      }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre Google Cloud projet.
APP_ID : ID de l'application Vertex AI Search que vous souhaitez interroger. L'application doit être connectée à un data store contenant des données structurées. L'application ne peut pas être une application de recherche combinée.
QUERY : requête écrite en langage naturel.
GEO_FIELD_NAME_1, GEO_FIELD_NAME_N : liste de valeurs de type geolocation. Si le type de valeur n'est pas geolocation, ce champ est ignoré.

Exemple de commande et résultat

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a chic and stylish hotel with at least 4 stars that is in San Francisco.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED",
  "geoSearchQueryDetectionFieldNames": ["location"]}
}'

{
"results": [
{
"id": "b2617d862",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
...
}
},
{
"id": "a51841841",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
...
}
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(star_rating: >= 4 AND GEO_DISTANCE("location", "San Francisco", 10000))",
"extractedFilterStructured": {
"expression": {
"andExpr": {
  "expressions": [
    {
      "numberConstraint": {
        "fieldName": "star_rating",
        "value": 4,
        "comparison": "GREATER_THAN_EQUALS",
      }
    },
    {
      "geolocationConstraint": {
        "fieldName": "location",
        "address": "San Francisco",
        "radius_in_meters": 10000,
      }
    },
  ]
}

Rechercher avec le filtre souple

Pour appliquer un filtre souple, procédez comme suit :

REST

Recherchez l'ID de votre application. Si vous disposez déjà de l'ID de votre application, passez à l'étape suivante.
1. Dans la Google Cloud console, accédez à la page Applications d'IA.
  
  Accédez à "Applications"
2. Sur la page Applications, recherchez le nom de votre application et obtenez son ID dans la colonne ID.

Exécutez la commande curl suivante, qui appelle la search méthode :

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre Google Cloud projet.
APP_ID : ID de votre application de recherche. L'application doit être connectée à un data store contenant des données structurées. L'application ne peut pas être une application de recherche combinée.
QUERY : requête en langage naturel.

Exemple de commande et réponse partielle

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search" \
  -d '{
        "query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

{
  "results": [
    {
      "id": "4246fcb660e398908bcd3007d9863ef8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/4246fcb660e398908bcd3007d9863ef8",
        "id": "4246fcb660e398908bcd3007d9863ef8",
        "structData": {
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "available_date": "2023-11-14",
          "amenities": [
            "Pet Friendly",
            "Pool",
            "Free Wi-Fi",
            "Bar"
          ],
          "location": {
            "zip_code": "23941",
            "country": "USA",
            "city": "South Amber",
            "state": "NH",
            "address": "2304 Nicholas Fort, Moorechester, MI 20090"
          },
          "id": 262,
          "contact": {
            "email": "eric59@example.com",
            "phone": "316-868-8020x2693"
          },
          "price_per_night": 112.48,
          "title": "Houston-Tran",
          "rating": 1.5
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true"
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.7236669,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.id",
            "value": 262
          },
          {
            "name": "c.rating",
            "value": 1.5
          },
          {
            "name": "c.price_per_night",
            "value": 112.48
          }
        ]
      }
    },
    {
      "id": "d729812e97b224b7a812e9ad0240ca3e",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/d729812e97b224b7a812e9ad0240ca3e",
        "id": "d729812e97b224b7a812e9ad0240ca3e",
        "structData": {
          "location": {
            "address": "38107 Mays Extension Apt. 070, Steventon, DC 31453",
            "state": "MA",
            "country": "USA",
            "zip_code": "25856",
            "city": "New Laura"
          },
          "title": "Serrano, Jackson and Carr",
          "available_date": "2024-04-05",
          "room_types": [
            "Single",
            "Deluxe",
            "Single"
          ],
          "price_per_night": 188.87,
          "contact": {
            "email": "knavarro@example.com",
            "phone": "(089)882-8916"
          },
          "id": 66,
          "rating": 4.3,
          "amenities": [
            "Pet Friendly",
            "Gym",
            "Pool",
            "Free Wi-Fi"
          ]
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0,
          "clearbox_escorer_score": 0.76363050937652588
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.7108109,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.id",
            "value": 66
          },
          {
            "name": "c.rating",
            "value": 4.3
          },
          {
            "name": "c.price_per_night",
            "value": 188.87
          }
        ]
      }
    },
    {
      "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/67e4484d2e6bf30bd3aa5229058cf3ad",
        "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
        "structData": {
          "rating": 4.6,
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "title": "Spencer-Small",
          "id": 249,
          "amenities": [
            "Pet Friendly",
            "Free Wi-Fi",
            "Pet Friendly",
            "Restaurant"
          ],
          "price_per_night": 66.38,
          "contact": {
            "phone": "+1-176-057-5439x71337",
            "email": "mike26@example.com"
          },
          "location": {
            "zip_code": "37354",
            "state": "WY",
            "city": "Port James",
            "address": "52979 Linda Orchard, New Ashley, GA 22405",
            "country": "USA"
          },
          "available_date": "2024-04-10"
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.71184474,
        "boostingFactor": 0,
        "defaultRank": 3,
        "customSignals": [
          {
            "name": "c.id",
            "value": 249
          },
          {
            "name": "c.rating",
            "value": 4.6
          },
          {
            "name": "c.price_per_night",
            "value": 66.38
          }
        ]
      }
    },
    ...
    {
      "id": "53d468f88b0d87b29bff51f8784d91a8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/53d468f88b0d87b29bff51f8784d91a8",
        "id": "53d468f88b0d87b29bff51f8784d91a8",
        "structData": {
          "contact": {
            "email": "bradley29@example.com",
            "phone": "404.120.7687x62482"
          },
          "price_per_night": 68.66,
          "rating": 3.3,
          "amenities": [
            "Restaurant",
            "Bar",
            "Pet Friendly",
            "Pool"
          ],
          "id": 25,
          "room_types": [
            "Suite",
            "Suite",
            "Double"
          ],
          "available_date": "2024-05-15",
          "title": "Wilson-Ward",
          "location": {
            "city": "East Sheila",
            "country": "USA",
            "state": "TX",
            "zip_code": "34921",
            "address": "60458 Fleming Freeway, South Holly, ME 64008"
          }
        },
        "derivedStructData": {
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.70549995,
        "boostingFactor": 0,
        "defaultRank": 49,
        "customSignals": [
          {
            "name": "c.id",
            "value": 25
          },
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.price_per_night",
            "value": 68.66
          }
        ]
      }
    },
    {
      "id": "653c16be81e88e23d694db625e474881",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/653c16be81e88e23d694db625e474881",
        "id": "653c16be81e88e23d694db625e474881",
        "structData": {
          "price_per_night": 443.9,
          "amenities": [
            "Pool",
            "Free Wi-Fi",
            "Parking",
            "Beach Access"
          ],
          "contact": {
            "email": "jamesblackburn@example.com",
            "phone": "155.107.3771"
          },
          "available_date": "2024-02-25",
          "id": 279,
          "room_types": [
            "Deluxe",
            "Penthouse",
            "Single"
          ],
          "title": "Wolf, Williams and Jenkins",
          "rating": 3.1,
          "location": {
            "address": "904 Kimberly Alley, Lake Aprilchester, WI 31242",
            "zip_code": "23652",
            "state": "SD",
            "country": "USA",
            "city": "Cunninghamside"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.76363050937652588,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.69835776,
        "boostingFactor": 0,
        "defaultRank": 50,
        "customSignals": [
          {
            "name": "c.id",
            "value": 279
          },
          {
            "name": "c.rating",
            "value": 3.1
          },
          {
            "name": "c.price_per_night",
            "value": 443.9
          }
        ]
      }
    }
  ],
  "totalSize": 106,
  "attributionToken": "mAL0FwEKDAiJ_4nIBhDH28e5ARIkNjkwMzk4ODktMDAwMC0yNGQ4LWJmYzEtMTRjMTRlZjFiNjcwIgdHRU5FUklDKkiVksUwjr6dFZ_Wty27kfoxvpH6MbaqojKugJM34-uQN9PaiTeQ97IwwvCeFdSynRXg65A3nNa3Lbe3jC2OkckwuaqiMtDaiTcwAVKMAXByb2plY3RzLzc1NjIwNjYwODQ3OS9sb2NhdGlvbnMvZ2xvYmFsL2NvbGxlY3Rpb25zL2RlZmF1bHRfY29sbGVjdGlvbi9lbmdpbmVzL2hvdGVscy1tYW55LXNlYXJjaF8xNzI0NDUyMzYwMzU2L3NlcnZpbmdDb25maWdzL2RlZmF1bHRfc2VhcmNo",
  "nextPageToken": "AzN2IWMmVGNxMGNx0SMjZmYtgDZ0ITLwADMw0CO4gTOzATO2QiGC8O-7WMEGgcmorICMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
    "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {},
  "naturalLanguageQueryUnderstandingInfo": {
    "extractedFilters": "(rating\u003e=4 AND price_per_night\u003c300 AND amenities: ANY(\"Pet Friendly\") AND amenities: ANY(\"Free Wi-Fi\"))",
    "structuredExtractedFilter": {
      "expression": {
        "andExpr": {
          "expressions": [
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Pet Friendly"
                ],
                "querySegment": "lets me bring my dog"
              }
            },
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Free Wi-Fi"
                ],
                "querySegment": "free Wi Fi"
              }
            },
            {
              "numberConstraint": {
                "fieldName": "rating",
                "comparison": "GREATER_THAN_EQUALS",
                "value": 4
              }
            },
            {
              "numberConstraint": {
                "fieldName": "price_per_night",
                "comparison": "LESS_THAN",
                "value": 300
              }
            }
          ]
        }
      }
    }
  }
}

Cet exemple de commande définit le comportement du filtre sur SOFT_BOOST, en remplaçant la valeur par défaut HARD_FILTER.

Spécifier des champs pour les requêtes en langage naturel

Pour qu'un champ soit utilisé comme filtre dans la compréhension des requêtes en langage naturel, il doit être marqué comme indexable dans le schéma. (Pour obtenir des informations générales sur l'affichage et la modification d'un schéma, consultez Mettre à jour un schéma.)

Vertex AI Search détermine les champs indexables du schéma qui peuvent être utilisés dans les filtres de compréhension des requêtes en langage naturel. Toutefois, si des champs sont inclus et que vous ne le souhaitez pas, vous devez créer une liste d'autorisation pour spécifier les champs qui peuvent être utilisés.

Prenons l'exemple d'un site de réservation d'hôtels, où les champs sont amenities, id, price_per_night, rating, et room_types. Parmi ceux-ci, si le id est une chaîne de caractères et de chiffres, Vertex AI Search est susceptible de l'exclure des champs utilisés pour la compréhension des requêtes en langage naturel.

Toutefois, si vous constatez que Vertex AI Search renvoie des résultats de requête de mauvaise qualité, car il n'exclut pas les champs qu'il devrait, vous devez spécifier les champs qui peuvent être utilisés. Par exemple, si le schéma de l'hôtel comporte un champ pour renovation_status qui n'est pas utile aux clients et qui pourrait être embarrassant pour la chaîne hôtelière, vous pouvez l'exclure de la liste des champs autorisés.

Exemple d'enregistrement du data store structuré de données hôtelières.

{
  "title": "Miller-Jones",
  "rating": 1.7,
  "price_per_night": 115.16,
  "id": 2902,
    …
  ],
  "amenities": [
    "Spa",
    "Parking",
    "Restaurant"
    …
  ],
  "renovation_status": "Restaurant and spa renovation planned for 2027"
}

Une liste d'autorisation appropriée pour les champs de cet exemple serait ["amenities", "price_per_night", "rating", "title"]. renovation_status est absent de la liste.

Pour spécifier une liste d'autorisation de champs pouvant être utilisés dans une compréhension des requêtes en langage naturel dans une recherche, procédez comme suit :

REST

Recherchez l'ID de votre application. Si vous disposez déjà de l'ID de votre application, passez à l'étape suivante.
1. Dans la Google Cloud console, accédez à la page Applications d'IA.
  
  Accédez à "Applications"
2. Sur la page Applications, recherchez le nom de votre application et obtenez son ID dans la colonne ID.

Exécutez la commande curl suivante, qui appelle la search méthode :

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["FIELD_1", "FIELD_2"],
    }
  }'

Remplacez les éléments suivants :

PROJECT_ID : ID de votre Google Cloud projet.
APP_ID : ID de votre application de recherche. L'application doit être connectée à un data store contenant des données structurées. L'application ne peut pas être une application de recherche combinée.
QUERY : requête en langage naturel.
FIELD_N : champ indexable du schéma qui peut être utilisé pour la compréhension des requêtes en langage naturel.

Exemple de commande et réponse partielle

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
  -H "Content-Type: application/json"
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
  -d '{
        "query": "A hotel with beach access for less than $150 a night.",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["amenities", "price_per_night", "rating"]
        }
  }'

{
  "results": [
    {
      "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/8dbf32e3e8d289c30a7c70bf4ba68bac",
        "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
        "structData": {
          "rating": 3.2,
          "location": {
            "city": "Jessicastad",
            "country": "USA",
            "zip_code": "18285",
            "state": "IA",
            "address": "552 Martin Gateway Apt. 964, Christinebury, OR 41179"
          },
          "contact": {
            "phone": "001-446-555-2265x7190",
            "email": "edwardscameron@example.com"
          },
          "amenities": [
            "Parking",
            "Beach Access",
            "Spa"
          ],
          "room_types": [
            "Double",
            "Deluxe",
            "Single"
          ],
          "id": 59,
          "title": "Williams, Richmond and Williams",
          "price_per_night": 143,
          "available_date": "2025-06-06"
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0.77886492013931274,
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.71246886,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.2
          },
          {
            "name": "c.id",
            "value": 59
          },
          {
            "name": "c.price_per_night",
            "value": 143
          }
        ]
      }
    },
    ...
    {
      "id": "fd5f0b4125a9c52420510aa1aa52eaff",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/fd5f0b4125a9c52420510aa1aa52eaff",
        "id": "fd5f0b4125a9c52420510aa1aa52eaff",
        "structData": {
          "amenities": [
            "Beach Access",
            "Spa",
            "Gym",
            "Pet Friendly"
          ],
          "room_types": [
            "Queen",
            "King",
            "Suite"
          ],
          "id": 277,
          "title": "Wyatt, Thomas and Price",
          "available_date": "2023-11-17",
          "contact": {
            "phone": "9745551788",
            "email": "shermandaniel@example.com"
          },
          "rating": 3.3,
          "price_per_night": 139.18,
          "location": {
            "address": "05952 Elaine Freeway, Lake Timothychester, MD 69485",
            "country": "USA",
            "state": "DC",
            "city": "North Marcusmouth",
            "zip_code": "23129"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.77886492013931274,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.7304497,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.id",
            "value": 277
          },
          {
            "name": "c.price_per_night",
            "value": 139.18
          }
        ]
      }
    }
  ],
  "totalSize": 17,
  "attributionToken": "lwL0FgEKCwj__drHBhCzzZdSEiQ2OTAwYTgzZC0wMDAwLTI5YzYtYjliMi03NDc0NDYzYjVjY2QiB0dFTkVSSUMqSJWSxTCQ97IwwvCeFZ_Wty25qqIy0NqJN9PaiTeugJM31LKdFY6-nRWc1rct4-uQN7e3jC2-kfoxjpHJMLuR-jG2qqIy4OuQNzABUowBcHJvamVjdHMvNzU2MjA2NjA4NDc5L2xvY2F0aW9ucy9nbG9iYWwvY29sbGVjdGlvbnMvZGVmYXVsdF9jb2xsZWN0aW9uL2VuZ2luZXMvaG90ZWxzLW1hbnktc2VhcmNoXzE3MjQ0NTIzNjA3NTYvc2VydmluZ0NvbmZpZ3MvZGVmYXVsdF9zZWFyY2g",
  "nextPageToken": "Q2YjVjYzYDN0cDN30iMiljYtYzY5ITLwADMw0yYzgTYwATO2QiGB0ZxBPIEGcs6m_PCMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
  "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {}
}

Cet exemple de commande permet d'utiliser les champs amenities, price_per_night, et rating dans les filtres de requêtes en langage naturel.

Filtrer avec la compréhension du langage naturel Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

À propos de la compréhension des requêtes en langage naturel

Filtres stricts et filtres souples

Exemples

Exemple : Extraction de champs à partir de requêtes (filtre strict)

Exemple : Avec un filtre de géolocalisation (filtre strict)

Exemple : Extraction de champs à partir de requêtes (filtre souple)

Limites

Avant de commencer

REST

Exemple de commande et de réponse

Rechercher en convertissant les requêtes en langage naturel en filtres

REST

Exemple de commande et résultat partiel

Rechercher en convertissant les lieux des requêtes en filtres de géolocalisation

REST

Exemple de commande et résultat

Rechercher avec le filtre souple

REST

Exemple de commande et réponse partielle

Spécifier des champs pour les requêtes en langage naturel

REST

Exemple de commande et réponse partielle

Filtrer avec la compréhension du langage naturel