Filtra con comprensión del lenguaje natural

En esta página, se explica cómo aplicar la comprensión del lenguaje natural para crear filtros automáticamente para las búsquedas y, de este modo, mejorar la calidad de los resultados que se muestran.

Puedes usar esta función con las apps de búsqueda que están conectadas a almacenes de datos estructurados.

Acerca de la comprensión de consultas en lenguaje natural

Si tienes una app de búsqueda personalizada con datos estructurados, las consultas en lenguaje natural de tus usuarios se pueden reformatear como consultas filtradas. Esto puede generar resultados de búsqueda de mejor calidad que la búsqueda de palabras en la cadena de búsqueda.

Por ejemplo, una búsqueda en lenguaje natural como "Find a coffee shop serving banana bread" podría reformularse como una búsqueda y un filtro: "query": "banana bread", "filter": "type": ANY(\"cafe\").

Usar la comprensión de consultas en lenguaje natural es más fácil y flexible que escribir tus propias expresiones de filtro. Para obtener información sobre cómo escribir expresiones de filtro, consulta Cómo filtrar la Búsqueda personalizada para datos estructurados o no estructurados.

Filtros suaves y duros

Existen dos tipos de filtros que puedes aplicar para la comprensión de consultas en lenguaje natural: rígidos y flexibles.

Difícil. De forma predeterminada, los filtros extraídos se aplican como criterios obligatorios que debe satisfacer un resultado para que se muestre.

El comportamiento es similar al del campo filter en la solicitud de búsqueda.
Suave. Una alternativa al filtro estricto es aplicar un aumento a los resultados de la búsqueda. Es más probable que se muestren los resultados potenciados, pero también se pueden mostrar los resultados que no cumplen con el criterio de potenciación.

El comportamiento es similar al del campo boostSpec en la solicitud de búsqueda.

Puedes experimentar con ambos tipos de filtros. Si las búsquedas no devuelven suficientes resultados, prueba el filtro flexible en lugar del filtro estricto.

Para obtener detalles sobre cómo aplicar un filtro flexible, consulta Cómo realizar búsquedas con el filtro flexible a continuación.

Ejemplos

Esta función se explica mejor con ejemplos:

En Ejemplo: Extracción de campos de consultas (filtro estricto), se muestran los filtros de campos extraídos de la consulta.
Ejemplo: Con un filtro de ubicación geográfica (filtro estricto) incluye el caso especial del filtro de ubicación geográfica.
Ejemplo: Extracción de campos de consultas (filtro flexible) muestra el filtro flexible que se extrajo de una consulta realizada a una app combinada.

Ejemplo: Extracción de campos de búsquedas (filtro estricto)

Esta función de comprensión de consultas en lenguaje natural se explica con el ejemplo de la búsqueda de un hotel.

Toma la siguiente búsqueda realizada en un almacén de datos estructurados para un sitio de hoteles: "Encuéntrame un hotel apto para familias con al menos cuatro estrellas que cueste menos de USD 300 por noche, me permita llevar a mi perro y tenga Wi-Fi gratis".

Sin la comprensión de consultas en lenguaje natural, la app de búsqueda busca documentos que contengan las palabras de la consulta.

Con la comprensión de consultas en lenguaje natural y los datos estructurados de forma adecuada, la búsqueda se vuelve más eficaz, ya que se reemplaza parte del lenguaje natural de la consulta por filtros. Si los datos estructurados tienen campos para star_rating (números), price (números) y amenities (cadenas), la búsqueda se puede formular para incluir los siguientes filtros:

   {
       "star_rating": >=4,
       "price": <=300,
       "amenities": "Wifi", "Pets Allowed"
   }

Ejemplo: Con un filtro de ubicación geográfica (filtro estricto)

Este ejemplo es similar al anterior, excepto que incluye un filtro de ubicación geográfica, que es un tipo especial de filtro extraído. Vertex AI Search puede reconocer ubicaciones en una búsqueda y crear filtros de proximidad para ellas.

Considera la siguiente búsqueda realizada en un sitio de empresas a nivel estatal: "Encuentra un hotel elegante y con estilo de al menos 4 estrellas en San Francisco".

Con la comprensión de preguntas en lenguaje natural y el filtro de ubicación geográfica, la búsqueda se reformula para incluir el siguiente filtro de un hotel con al menos una calificación de 4 estrellas y dentro de un radio de 10 km de San Francisco:

   {
       "star_rating": >=4,
       "location": GEO_DISTANCE(\"San Francisco, CA\", 10000)
   }

En este ejemplo, GEO_DISTANCE es una dirección, pero en otras búsquedas, podría escribirse como una latitud y una longitud, aunque la búsqueda original contenga una dirección.

Ejemplo: Extracción de campos de búsquedas (filtro flexible)

Esta función de comprensión de consultas en lenguaje natural se explica a través del ejemplo de la búsqueda de un hotel, pero se muestran algunos resultados que no cumplen con todos los criterios.

Considera la siguiente búsqueda realizada en un sitio de viajes: "Encuentra un hotel apto para familias con al menos cuatro estrellas que cueste menos de USD 300 por noche y que me permita llevar a mi perro".

Con la comprensión de consultas en lenguaje natural y los datos estructurados de forma adecuada, la búsqueda se vuelve más eficaz, ya que se reemplaza parte del lenguaje natural de la consulta por filtros flexibles. Si los datos estructurados tienen campos para star_rating (números), price (números) y amenities (cadenas), la consulta se puede reescribir como el siguiente refuerzo:

Condición de aumento extraída de la búsqueda en lenguaje natural:

{
  "boostSpec": {
    "conditionBoostSpecs": {
      "condition": "(star_rating >= 4.5) AND (price < 200) AND ANY(amenities, \"Pets Allowed\")",
      "boost": 0.7
    }
  }
}

En este caso, es posible que se muestren algunos hoteles con calificaciones más bajas o que no admitan mascotas.

La intensidad del refuerzo depende de la cantidad de filtros estructurados con los que coincide un documento. Si se extraen tres condiciones y el documento coincide solo con una de ellas, el documento recibe un pequeño aumento. De lo contrario, si el documento cumple con las tres condiciones, se le otorga un aumento significativo.

Limitaciones

Las siguientes limitaciones se aplican a la comprensión de preguntas en lenguaje natural:

La comprensión de consultas en lenguaje natural no se puede aplicar a las apps de búsqueda combinada. Recibirás un error si intentas usar la comprensión de consultas en lenguaje natural con una app de búsqueda combinada.
La comprensión de consultas en lenguaje natural solo funciona para las apps de búsqueda personalizadas que usan almacenes de datos estructurados.
Usar la comprensión de preguntas en lenguaje natural aumenta la latencia, por lo que es posible que decidas no usarla si la latencia es un problema.
En el caso de la geolocalización, la ubicación debe describirse de forma explícita. No puedes usar ubicaciones como "cerca de mí" o "casa".
El radio de la ubicación geográfica es de 10 km y no se puede configurar.
Los campos booleanos no se pueden usar en los filtros. Por ejemplo, si la búsqueda es "Encuentra una habitación de hotel para no fumadores", un campo booleano como "non_smoking": true no es útil, pero un campo de cadena como "non_smoking": "YES" puede formar parte del filtro.

Antes de comenzar

Antes de comenzar a usar la comprensión de consultas en lenguaje natural, debes habilitarla para los almacenes de datos estructurados conectados a las apps que planeas usar.

Para habilitar la comprensión de consultas en lenguaje natural, sigue estos pasos:

REST

Busca el ID de tu almacén de datos. Si ya tienes el ID de tu almacén de datos, ve al siguiente paso.
1. En la consola de Google Cloud , ve a la página Aplicaciones basadas en IA y, en el menú de navegación, haz clic en Almacenes de datos.
  
  Ir a la página Almacenes de datos.
2. Haz clic en el nombre de tu almacén de datos.
3. En la página Datos de tu almacén de datos, obtén el ID del almacén de datos.

Ejecuta el siguiente comando de curl:

curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID?update_mask=natural_language_query_understanding_config.mode" \
-d '{
      "naturalLanguageQueryUnderstandingConfig": {
        "mode": "ENABLED"
      }
    }'

Reemplaza lo siguiente:

PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
DATA_STORE_ID: Es el ID del almacén de datos de Vertex AI Search.

Ejemplo de comando y respuesta

curl -X PATCH
-H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
-H "X-Goog-User-Project: my-project-123"
"https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store?update_mask=natural_language_query_understanding_config.mode"
-d '{
       "naturalLanguageQueryUnderstandingConfig": {
         "mode": "ENABLED"
       }
    }'

{
  "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store",
  "displayName": "test_data_store",
  "industryVertical": "GENERIC",
  "createTime": "2024-07-10T18:50:01.673414Z",
  "solutionTypes": [
    "SOLUTION_TYPE_SEARCH"
  ],
  "defaultSchemaId": "default_schema",
  "documentProcessingConfig": {
    "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store/documentProcessingConfig",
    "defaultParsingConfig": {
      "digitalParsingConfig": {}
    }
  },
  "servingConfigDataStore": {},
  "naturalLanguageQueryUnderstandingConfig": {
    "mode": "ENABLED"
  }
}

Repite los pasos 1 y 2 para cada almacén de datos.
Espera aproximadamente 24 horas.

Si intentas usar la comprensión de consultas en lenguaje natural antes de que el almacén de datos esté listo, la respuesta que obtendrás será la misma que si filterExtractionCondition se hubiera establecido en DISABLED.

Búsqueda, que convierte las consultas en lenguaje natural en filtros

Para buscar una consulta en lenguaje natural y obtener resultados optimizados para consultas en lenguaje natural, haz lo siguiente:

REST

Ejecuta el siguiente comando de curl, que llama al método search:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED"
        }
      }'

Reemplaza lo siguiente:

PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
APP_ID: Es el ID de la app de Vertex AI Search que deseas consultar. La app debe estar conectada a un almacén de datos que contenga datos estructurados. La app no puede ser una app de búsqueda combinada.
QUERY: Es la búsqueda escrita en lenguaje natural.

Ejemplo de comando y resultado parcial

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED"}
}'

{
"results": [
{
  "id": "b2617d862",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
    ...
  }
},
{
  "id": "a51841841",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
    ...
  }
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(amenities: ANY(\"Pets Allowed\") AND amenities: ANY(\"Wifi\") AND star_rating: >= 4 AND price: < 300)",
"extractedFilterStructured": {
  "expression": {
    "andExpr": {
      "expressions": [
        {
          "numberConstraint": {
            "fieldName": "star_rating",
            "value": 4,
            "comparison": "GREATER_THAN_EQUALS",
          }
        },
        {
          "numberConstraint": {
            "fieldName": "price",
            "value": 300,
            "comparison": "LESS_THAN",
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Pets Allowed"]
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Wifi"]
          }
        },
      ]
    }

Búsqueda, que convierte las ubicaciones de las búsquedas en filtros de ubicación geográfica

Para buscar una consulta en lenguaje natural y obtener resultados optimizados para consultas en lenguaje natural, incluida la proximidad a ubicaciones, haz lo siguiente:

REST

Ejecuta el siguiente comando de curl, que llama al método search:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "geoSearchQueryDetectionFieldNames": ["GEO_FIELD_NAME_1", "GEO_FIELD_NAME_N"]"
        }
      }'

Reemplaza lo siguiente:

PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
APP_ID: Es el ID de la app de Vertex AI Search que deseas consultar. La app debe estar conectada a un almacén de datos que contenga datos estructurados. La app no puede ser una app de búsqueda combinada.
QUERY: Es la búsqueda escrita en lenguaje natural.
GEO_FIELD_NAME_1, GEO_FIELD_NAME_N: Es una lista de valores de tipo geolocation. Si el tipo de valor no es geolocation, se ignora este campo.

Ejemplo de comando y resultado

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a chic and stylish hotel with at least 4 stars that is in San Francisco.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED",
  "geoSearchQueryDetectionFieldNames": ["location"]}
}'

{
"results": [
{
"id": "b2617d862",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
...
}
},
{
"id": "a51841841",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
...
}
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(star_rating: >= 4 AND GEO_DISTANCE("location", "San Francisco", 10000))",
"extractedFilterStructured": {
"expression": {
"andExpr": {
  "expressions": [
    {
      "numberConstraint": {
        "fieldName": "star_rating",
        "value": 4,
        "comparison": "GREATER_THAN_EQUALS",
      }
    },
    {
      "geolocationConstraint": {
        "fieldName": "location",
        "address": "San Francisco",
        "radius_in_meters": 10000,
      }
    },
  ]
}

Cómo buscar con el filtro suave

Para aplicar un filtro suave, haz lo siguiente:

REST

Busca el ID de tu app. Si ya tienes el ID de tu app, ve al siguiente paso.
1. En la consola de Google Cloud , ve a la página AI Applications.
  
  Ve a Apps.
2. En la página Apps, busca el nombre de tu app y obtén su ID en la columna ID.

Ejecuta el siguiente comando de curl, que llama al método search:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

Reemplaza lo siguiente:

PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
APP_ID: Es el ID de tu app de búsqueda. La app debe estar conectada a un almacén de datos que contenga datos estructurados. La app no puede ser una app de búsqueda combinada.
QUERY: Es tu búsqueda en lenguaje natural.

Ejemplo de comando y respuesta parcial

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search" \
  -d '{
        "query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

{
  "results": [
    {
      "id": "4246fcb660e398908bcd3007d9863ef8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/4246fcb660e398908bcd3007d9863ef8",
        "id": "4246fcb660e398908bcd3007d9863ef8",
        "structData": {
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "available_date": "2023-11-14",
          "amenities": [
            "Pet Friendly",
            "Pool",
            "Free Wi-Fi",
            "Bar"
          ],
          "location": {
            "zip_code": "23941",
            "country": "USA",
            "city": "South Amber",
            "state": "NH",
            "address": "2304 Nicholas Fort, Moorechester, MI 20090"
          },
          "id": 262,
          "contact": {
            "email": "eric59@example.com",
            "phone": "316-868-8020x2693"
          },
          "price_per_night": 112.48,
          "title": "Houston-Tran",
          "rating": 1.5
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true"
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.7236669,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.id",
            "value": 262
          },
          {
            "name": "c.rating",
            "value": 1.5
          },
          {
            "name": "c.price_per_night",
            "value": 112.48
          }
        ]
      }
    },
    {
      "id": "d729812e97b224b7a812e9ad0240ca3e",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/d729812e97b224b7a812e9ad0240ca3e",
        "id": "d729812e97b224b7a812e9ad0240ca3e",
        "structData": {
          "location": {
            "address": "38107 Mays Extension Apt. 070, Steventon, DC 31453",
            "state": "MA",
            "country": "USA",
            "zip_code": "25856",
            "city": "New Laura"
          },
          "title": "Serrano, Jackson and Carr",
          "available_date": "2024-04-05",
          "room_types": [
            "Single",
            "Deluxe",
            "Single"
          ],
          "price_per_night": 188.87,
          "contact": {
            "email": "knavarro@example.com",
            "phone": "(089)882-8916"
          },
          "id": 66,
          "rating": 4.3,
          "amenities": [
            "Pet Friendly",
            "Gym",
            "Pool",
            "Free Wi-Fi"
          ]
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0,
          "clearbox_escorer_score": 0.76363050937652588
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.7108109,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.id",
            "value": 66
          },
          {
            "name": "c.rating",
            "value": 4.3
          },
          {
            "name": "c.price_per_night",
            "value": 188.87
          }
        ]
      }
    },
    {
      "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/67e4484d2e6bf30bd3aa5229058cf3ad",
        "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
        "structData": {
          "rating": 4.6,
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "title": "Spencer-Small",
          "id": 249,
          "amenities": [
            "Pet Friendly",
            "Free Wi-Fi",
            "Pet Friendly",
            "Restaurant"
          ],
          "price_per_night": 66.38,
          "contact": {
            "phone": "+1-176-057-5439x71337",
            "email": "mike26@example.com"
          },
          "location": {
            "zip_code": "37354",
            "state": "WY",
            "city": "Port James",
            "address": "52979 Linda Orchard, New Ashley, GA 22405",
            "country": "USA"
          },
          "available_date": "2024-04-10"
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.71184474,
        "boostingFactor": 0,
        "defaultRank": 3,
        "customSignals": [
          {
            "name": "c.id",
            "value": 249
          },
          {
            "name": "c.rating",
            "value": 4.6
          },
          {
            "name": "c.price_per_night",
            "value": 66.38
          }
        ]
      }
    },
    ...
    {
      "id": "53d468f88b0d87b29bff51f8784d91a8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/53d468f88b0d87b29bff51f8784d91a8",
        "id": "53d468f88b0d87b29bff51f8784d91a8",
        "structData": {
          "contact": {
            "email": "bradley29@example.com",
            "phone": "404.120.7687x62482"
          },
          "price_per_night": 68.66,
          "rating": 3.3,
          "amenities": [
            "Restaurant",
            "Bar",
            "Pet Friendly",
            "Pool"
          ],
          "id": 25,
          "room_types": [
            "Suite",
            "Suite",
            "Double"
          ],
          "available_date": "2024-05-15",
          "title": "Wilson-Ward",
          "location": {
            "city": "East Sheila",
            "country": "USA",
            "state": "TX",
            "zip_code": "34921",
            "address": "60458 Fleming Freeway, South Holly, ME 64008"
          }
        },
        "derivedStructData": {
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.70549995,
        "boostingFactor": 0,
        "defaultRank": 49,
        "customSignals": [
          {
            "name": "c.id",
            "value": 25
          },
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.price_per_night",
            "value": 68.66
          }
        ]
      }
    },
    {
      "id": "653c16be81e88e23d694db625e474881",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/653c16be81e88e23d694db625e474881",
        "id": "653c16be81e88e23d694db625e474881",
        "structData": {
          "price_per_night": 443.9,
          "amenities": [
            "Pool",
            "Free Wi-Fi",
            "Parking",
            "Beach Access"
          ],
          "contact": {
            "email": "jamesblackburn@example.com",
            "phone": "155.107.3771"
          },
          "available_date": "2024-02-25",
          "id": 279,
          "room_types": [
            "Deluxe",
            "Penthouse",
            "Single"
          ],
          "title": "Wolf, Williams and Jenkins",
          "rating": 3.1,
          "location": {
            "address": "904 Kimberly Alley, Lake Aprilchester, WI 31242",
            "zip_code": "23652",
            "state": "SD",
            "country": "USA",
            "city": "Cunninghamside"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.76363050937652588,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.69835776,
        "boostingFactor": 0,
        "defaultRank": 50,
        "customSignals": [
          {
            "name": "c.id",
            "value": 279
          },
          {
            "name": "c.rating",
            "value": 3.1
          },
          {
            "name": "c.price_per_night",
            "value": 443.9
          }
        ]
      }
    }
  ],
  "totalSize": 106,
  "attributionToken": "mAL0FwEKDAiJ_4nIBhDH28e5ARIkNjkwMzk4ODktMDAwMC0yNGQ4LWJmYzEtMTRjMTRlZjFiNjcwIgdHRU5FUklDKkiVksUwjr6dFZ_Wty27kfoxvpH6MbaqojKugJM34-uQN9PaiTeQ97IwwvCeFdSynRXg65A3nNa3Lbe3jC2OkckwuaqiMtDaiTcwAVKMAXByb2plY3RzLzc1NjIwNjYwODQ3OS9sb2NhdGlvbnMvZ2xvYmFsL2NvbGxlY3Rpb25zL2RlZmF1bHRfY29sbGVjdGlvbi9lbmdpbmVzL2hvdGVscy1tYW55LXNlYXJjaF8xNzI0NDUyMzYwMzU2L3NlcnZpbmdDb25maWdzL2RlZmF1bHRfc2VhcmNo",
  "nextPageToken": "AzN2IWMmVGNxMGNx0SMjZmYtgDZ0ITLwADMw0CO4gTOzATO2QiGC8O-7WMEGgcmorICMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
    "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {},
  "naturalLanguageQueryUnderstandingInfo": {
    "extractedFilters": "(rating\u003e=4 AND price_per_night\u003c300 AND amenities: ANY(\"Pet Friendly\") AND amenities: ANY(\"Free Wi-Fi\"))",
    "structuredExtractedFilter": {
      "expression": {
        "andExpr": {
          "expressions": [
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Pet Friendly"
                ],
                "querySegment": "lets me bring my dog"
              }
            },
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Free Wi-Fi"
                ],
                "querySegment": "free Wi Fi"
              }
            },
            {
              "numberConstraint": {
                "fieldName": "rating",
                "comparison": "GREATER_THAN_EQUALS",
                "value": 4
              }
            },
            {
              "numberConstraint": {
                "fieldName": "price_per_night",
                "comparison": "LESS_THAN",
                "value": 300
              }
            }
          ]
        }
      }
    }
  }
}

Este comando de ejemplo establece el comportamiento del filtro en SOFT_BOOST, lo que anula el valor predeterminado HARD_FILTER.

Especifica campos para las consultas en lenguaje natural

Para que un campo se use como filtro en la comprensión de consultas en lenguaje natural, debe marcarse como indexable en el esquema. (Para obtener información general sobre cómo ver y editar un esquema, consulta Actualiza un esquema).

Vertex AI Search determina cuáles de los campos indexables del esquema tienen sentido usar en los filtros de comprensión de consultas en lenguaje natural. Sin embargo, si se incluyen campos que no deseas, debes crear una lista de entidades permitidas para especificar qué campos se pueden usar.

Considera un sitio de reservas de hoteles en el que hay campos como amenities, id, price_per_night, rating y room_types. De estos, si id es una cadena de caracteres y números, es probable que Vertex AI Search lo excluya de los campos que se usan para la comprensión de consultas en lenguaje natural.

Sin embargo, si observas que Vertex AI Search devuelve resultados de búsqueda de baja calidad porque no excluye los campos que debería, debes especificar qué campos se pueden usar. Por ejemplo, si el esquema del hotel tiene un campo para renovation_status que no es útil para los clientes y podría ser vergonzoso para la cadena hotelera, puedes excluirlo de la lista de campos permitidos.

Ejemplo de un registro del almacén de datos estructurados de datos de hoteles.

{
  "title": "Miller-Jones",
  "rating": 1.7,
  "price_per_night": 115.16,
  "id": 2902,
    …
  ],
  "amenities": [
    "Spa",
    "Parking",
    "Restaurant"
    …
  ],
  "renovation_status": "Restaurant and spa renovation planned for 2027"
}

Una lista de entidades permitidas adecuada para los campos de este ejemplo sería ["amenities", "price_per_night", "rating", "title"]. En la lista, falta renovation_status.

Para especificar una lista de entidades permitidas de campos que se pueden usar en la comprensión de consultas en lenguaje natural en una búsqueda, haz lo siguiente:

REST

Busca el ID de tu app. Si ya tienes el ID de tu app, ve al siguiente paso.
1. En la consola de Google Cloud , ve a la página AI Applications.
  
  Ve a Apps.
2. En la página Apps, busca el nombre de tu app y obtén su ID en la columna ID.

Ejecuta el siguiente comando de curl, que llama al método search:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["FIELD_1", "FIELD_2"],
    }
  }'

Reemplaza lo siguiente:

PROJECT_ID: Es el ID de tu proyecto de Google Cloud .
APP_ID: Es el ID de tu app de búsqueda. La app debe estar conectada a un almacén de datos que contenga datos estructurados. La app no puede ser una app de búsqueda combinada.
QUERY: Es tu búsqueda en lenguaje natural.
FIELD_N: Es un campo indexable en el esquema que se puede usar para la comprensión de consultas en lenguaje natural.

Ejemplo de comando y respuesta parcial

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
  -H "Content-Type: application/json"
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
  -d '{
        "query": "A hotel with beach access for less than $150 a night.",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["amenities", "price_per_night", "rating"]
        }
  }'

{
  "results": [
    {
      "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/8dbf32e3e8d289c30a7c70bf4ba68bac",
        "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
        "structData": {
          "rating": 3.2,
          "location": {
            "city": "Jessicastad",
            "country": "USA",
            "zip_code": "18285",
            "state": "IA",
            "address": "552 Martin Gateway Apt. 964, Christinebury, OR 41179"
          },
          "contact": {
            "phone": "001-446-555-2265x7190",
            "email": "edwardscameron@example.com"
          },
          "amenities": [
            "Parking",
            "Beach Access",
            "Spa"
          ],
          "room_types": [
            "Double",
            "Deluxe",
            "Single"
          ],
          "id": 59,
          "title": "Williams, Richmond and Williams",
          "price_per_night": 143,
          "available_date": "2025-06-06"
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0.77886492013931274,
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.71246886,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.2
          },
          {
            "name": "c.id",
            "value": 59
          },
          {
            "name": "c.price_per_night",
            "value": 143
          }
        ]
      }
    },
    ...
    {
      "id": "fd5f0b4125a9c52420510aa1aa52eaff",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/fd5f0b4125a9c52420510aa1aa52eaff",
        "id": "fd5f0b4125a9c52420510aa1aa52eaff",
        "structData": {
          "amenities": [
            "Beach Access",
            "Spa",
            "Gym",
            "Pet Friendly"
          ],
          "room_types": [
            "Queen",
            "King",
            "Suite"
          ],
          "id": 277,
          "title": "Wyatt, Thomas and Price",
          "available_date": "2023-11-17",
          "contact": {
            "phone": "9745551788",
            "email": "shermandaniel@example.com"
          },
          "rating": 3.3,
          "price_per_night": 139.18,
          "location": {
            "address": "05952 Elaine Freeway, Lake Timothychester, MD 69485",
            "country": "USA",
            "state": "DC",
            "city": "North Marcusmouth",
            "zip_code": "23129"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.77886492013931274,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.7304497,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.id",
            "value": 277
          },
          {
            "name": "c.price_per_night",
            "value": 139.18
          }
        ]
      }
    }
  ],
  "totalSize": 17,
  "attributionToken": "lwL0FgEKCwj__drHBhCzzZdSEiQ2OTAwYTgzZC0wMDAwLTI5YzYtYjliMi03NDc0NDYzYjVjY2QiB0dFTkVSSUMqSJWSxTCQ97IwwvCeFZ_Wty25qqIy0NqJN9PaiTeugJM31LKdFY6-nRWc1rct4-uQN7e3jC2-kfoxjpHJMLuR-jG2qqIy4OuQNzABUowBcHJvamVjdHMvNzU2MjA2NjA4NDc5L2xvY2F0aW9ucy9nbG9iYWwvY29sbGVjdGlvbnMvZGVmYXVsdF9jb2xsZWN0aW9uL2VuZ2luZXMvaG90ZWxzLW1hbnktc2VhcmNoXzE3MjQ0NTIzNjA3NTYvc2VydmluZ0NvbmZpZ3MvZGVmYXVsdF9zZWFyY2g",
  "nextPageToken": "Q2YjVjYzYDN0cDN30iMiljYtYzY5ITLwADMw0yYzgTYwATO2QiGB0ZxBPIEGcs6m_PCMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
  "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {}
}

Este comando de ejemplo permite que los campos amenities, price_per_night y rating se usen en filtros de búsqueda en lenguaje natural.

Filtra con comprensión del lenguaje natural Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Acerca de la comprensión de consultas en lenguaje natural

Filtros suaves y duros

Ejemplos

Ejemplo: Extracción de campos de búsquedas (filtro estricto)

Ejemplo: Con un filtro de ubicación geográfica (filtro estricto)

Ejemplo: Extracción de campos de búsquedas (filtro flexible)

Limitaciones

Antes de comenzar

REST

Ejemplo de comando y respuesta

Búsqueda, que convierte las consultas en lenguaje natural en filtros

REST

Ejemplo de comando y resultado parcial

Búsqueda, que convierte las ubicaciones de las búsquedas en filtros de ubicación geográfica

REST

Ejemplo de comando y resultado

Cómo buscar con el filtro suave

REST

Ejemplo de comando y respuesta parcial

Especifica campos para las consultas en lenguaje natural

REST

Ejemplo de comando y respuesta parcial

Filtra con comprensión del lenguaje natural