Mit Natural Language Understanding filtern

Auf dieser Seite wird beschrieben, wie Sie Natural Language Understanding anwenden, um automatisch Filter für Suchanfragen zu erstellen und so die Qualität der zurückgegebenen Ergebnisse zu verbessern.

Sie können diese Funktion mit Suchanwendungen verwenden, die mit strukturierten Datenspeichern verbunden sind.

Interpretation von Anfragen in natürlicher Sprache

Wenn Sie eine benutzerdefinierte Suchanwendung mit strukturierten Daten haben, können die Anfragen Ihrer Nutzer in natürlicher Sprache als gefilterte Anfragen neu formatiert werden. Das kann zu besseren Suchergebnissen führen, als wenn Sie nach Wörtern im Abfragestring suchen.

Eine Abfrage in natürlicher Sprache wie "Find a coffee shop serving banana bread" kann beispielsweise als Abfrage und Filter neu formuliert werden: "query": "banana bread", "filter": "type": ANY(\"cafe\").

Die Auswertung von Anfragen in natürlicher Sprache ist einfacher und flexibler als das Schreiben eigener Filterausdrücke. Informationen zum Schreiben von Filterausdrücken finden Sie unter Benutzerdefinierte Suche nach strukturierten oder unstrukturierten Daten filtern.

Harte und weiche Filter

Es gibt zwei Arten von Filtern, die Sie für die Auswertung von Anfragen in natürlicher Sprache anwenden können: hart und weich.

Schwierig Standardmäßig werden extrahierte Filter als obligatorische Kriterien angewendet, die ein Ergebnis erfüllen muss, um zurückgegeben zu werden.

Das Verhalten ähnelt dem Feld filter in der Suchanfrage.
Weich Alternativ zum harten Filter können Sie die Suchergebnisse auch verstärken. Es ist wahrscheinlicher, dass Ergebnisse mit höherer Gewichtung zurückgegeben werden. Es können aber auch Ergebnisse zurückgegeben werden, die das Kriterium für die höhere Gewichtung nicht erfüllen.

Das Verhalten ähnelt dem Feld boostSpec in der Suchanfrage.

Sie können mit beiden Arten von Filtern experimentieren. Wenn bei Suchanfragen nicht genügend Ergebnisse zurückgegeben werden, verwenden Sie den weichen anstelle des harten Filters.

Weitere Informationen zum Anwenden eines Soft-Filters finden Sie unten unter Mit dem Soft-Filter suchen.

Beispiele

Diese Funktion lässt sich am besten anhand von Beispielen erklären:

Im Beispiel: Feldextraktion aus Abfragen (Hard Filter) sehen Sie die aus der Abfrage extrahierten Feldfilter.
Beispiel: Mit einem Geolocation-Filter (Hard-Filter) enthält den Sonderfall des Geolocation-Filters.
Beispiel: Feldextraktion aus Anfragen (weicher Filter) zeigt den weichen Filter, der aus einer Anfrage an eine zusammengeführte App extrahiert wurde.

Beispiel: Felder aus Abfragen extrahieren (Hard Filter)

Diese Funktion zur Auswertung von Anfragen in natürlicher Sprache wird anhand des Beispiels der Suche nach einem Hotel erläutert.

Hier ist eine Anfrage, die an einen strukturierten Datenspeicher für eine Hotelwebsite gerichtet ist: „Finde ein familienfreundliches Hotel mit mindestens vier Sternen, das weniger als 300 € pro Nacht kostet, in dem ich meinen Hund mitbringen kann und das kostenloses WLAN bietet.“

Ohne die Interpretation von Anfragen in natürlicher Sprache sucht die Such-App nach Dokumenten, die die Wörter in der Anfrage enthalten.

Durch die Auswertung von Anfragen in natürlicher Sprache und entsprechend strukturierte Daten wird die Suche effektiver, da ein Teil der natürlichen Sprache in der Anfrage durch Filter ersetzt wird. Wenn die strukturierten Daten Felder für star_rating (Zahlen), price (Zahlen) und amenities (Strings) enthalten, kann die Anfrage so formuliert werden, dass die folgenden Filter enthalten sind:

   {
       "star_rating": >=4,
       "price": <=300,
       "amenities": "Wifi", "Pets Allowed"
   }

Beispiel: Mit einem Geolocation-Filter (Hard-Filter)

Dieses Beispiel ähnelt dem vorherigen, enthält aber einen geolocation-Filter, der eine spezielle Art von extrahiertem Filter ist. Vertex AI Search kann Orte in einer Anfrage erkennen und Näherungsfilter für die Orte erstellen.

Hier ist eine Anfrage, die an eine unternehmensweite Website gerichtet wurde: „Suche ein schickes und stilvolles Hotel mit mindestens 4 Sternen in San Francisco.“

Dank des Verständnisses von Anfragen in natürlicher Sprache und des Geolocation-Filters wird die Suche so umformuliert, dass sie den folgenden Filter für ein Hotel mit mindestens 4 Sternen und einem Radius von 10 km um San Francisco enthält:

   {
       "star_rating": >=4,
       "location": GEO_DISTANCE(\"San Francisco, CA\", 10000)
   }

In diesem Beispiel ist GEO_DISTANCE eine Adresse. In anderen Anfragen kann sie jedoch als Breiten- und Längengrad angegeben sein, obwohl die ursprüngliche Anfrage eine Adresse enthielt.

Beispiel: Felder aus Abfragen extrahieren (weicher Filter)

Diese Funktion zum Verarbeiten von Suchanfragen in natürlicher Sprache wird anhand des Beispiels der Suche nach einem Hotel erläutert, bei der einige Ergebnisse angezeigt werden, die nicht alle Kriterien erfüllen.

Hier ist eine Anfrage, die an eine Reisewebsite gerichtet wurde: „Suche mir ein familienfreundliches Hotel mit mindestens vier Sternen, das weniger als 300 € pro Nacht kostet und in dem ich meinen Hund mitbringen kann.“

Durch die Auswertung von Anfragen in natürlicher Sprache und entsprechend strukturierte Daten wird die Suche effektiver, da ein Teil der natürlichen Sprache in der Anfrage durch Softfilter ersetzt wird. Wenn die strukturierten Daten Felder für star_rating (Zahlen), price (Zahlen) und amenities (Strings) enthalten, kann die Anfrage als folgender Boost neu geschrieben werden:

Aus der Abfrage in natürlicher Sprache extrahierte Bedingung für die Steigerung:

{
  "boostSpec": {
    "conditionBoostSpecs": {
      "condition": "(star_rating >= 4.5) AND (price < 200) AND ANY(amenities, \"Pets Allowed\")",
      "boost": 0.7
    }
  }
}

In diesem Fall werden möglicherweise Hotels mit niedrigeren Bewertungen oder Hotels, in denen keine Haustiere erlaubt sind, zurückgegeben.

Die Stärke des Boosts hängt von der Anzahl der strukturierten Filter ab, die mit einem Dokument übereinstimmen. Wenn drei Bedingungen extrahiert werden und das Dokument nur einer der Bedingungen entspricht, erhält es einen kleinen Boost. Wenn das Dokument alle drei Bedingungen erfüllt, wird es stark hochgestuft.

Beschränkungen

Für das Verarbeiten von Anfragen in natürlicher Sprache gelten die folgenden Einschränkungen:

Die Interpretation von Anfragen in natürlicher Sprache kann nicht auf Apps für die kombinierte Suche angewendet werden. Wenn Sie versuchen, die Verarbeitung von Anfragen in natürlicher Sprache mit einer App für die kombinierte Suche zu verwenden, erhalten Sie eine Fehlermeldung.
Die Interpretation von Anfragen in natürlicher Sprache funktioniert nur für benutzerdefinierte Such-Apps, die strukturierte Datenspeicher verwenden.
Die Verwendung der Interpretation von Anfragen in natürlicher Sprache erhöht die Latenz. Wenn Latenz ein Problem darstellt, sollten Sie diese Funktion daher nicht verwenden.
Bei der Geolocation muss der Standort explizit beschrieben werden. Sie können keine Orte wie „in meiner Nähe“ oder „Zuhause“ verwenden.
Der Radius für die Standortbestimmung beträgt 10 km und kann nicht konfiguriert werden.
Boolesche Felder können nicht in Filtern verwendet werden. Wenn die Anfrage beispielsweise „Finde ein Nichtraucher-Hotelzimmer für mich“ lautet, ist ein boolesches Feld wie "non_smoking": true nicht hilfreich, aber ein Stringfeld wie "non_smoking": "YES" kann Teil des Filters sein.

Hinweis

Bevor Sie die Funktion zum Verarbeiten von Anfragen in natürlicher Sprache verwenden können, müssen Sie sie für die strukturierten Datenspeicher aktivieren, die mit den Apps verbunden sind, die Sie verwenden möchten.

So aktivieren Sie die Interpretation von Anfragen in natürlicher Sprache:

REST

Suchen Sie nach Ihrer Datenspeicher-ID. Wenn Sie die ID Ihres Datenspeichers bereits haben, fahren Sie mit dem nächsten Schritt fort.
1. Rufen Sie in der Google Cloud Console die Seite KI-Anwendungen auf und klicken Sie im Navigationsmenü auf Datenspeicher.
  
  Rufen Sie die Seite Datenspeicher auf.
2. Klicken Sie auf den Namen des Datenspeichers.
3. Rufen Sie auf der Datenseite Ihres Datenspeichers die Datenspeicher-ID ab.

Führen Sie den folgenden curl-Befehl aus:

curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID?update_mask=natural_language_query_understanding_config.mode" \
-d '{
      "naturalLanguageQueryUnderstandingConfig": {
        "mode": "ENABLED"
      }
    }'

Ersetzen Sie Folgendes:

PROJECT_ID: die ID Ihres Projekts in Google Cloud .
DATA_STORE_ID: Die ID des Vertex AI Search-Datenspeichers.

Beispiel für Befehl und Antwort

curl -X PATCH
-H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
-H "X-Goog-User-Project: my-project-123"
"https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store?update_mask=natural_language_query_understanding_config.mode"
-d '{
       "naturalLanguageQueryUnderstandingConfig": {
         "mode": "ENABLED"
       }
    }'

{
  "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store",
  "displayName": "test_data_store",
  "industryVertical": "GENERIC",
  "createTime": "2024-07-10T18:50:01.673414Z",
  "solutionTypes": [
    "SOLUTION_TYPE_SEARCH"
  ],
  "defaultSchemaId": "default_schema",
  "documentProcessingConfig": {
    "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store/documentProcessingConfig",
    "defaultParsingConfig": {
      "digitalParsingConfig": {}
    }
  },
  "servingConfigDataStore": {},
  "naturalLanguageQueryUnderstandingConfig": {
    "mode": "ENABLED"
  }
}

Wiederholen Sie die Schritte 1 und 2 für jeden Datenspeicher.
Warten Sie etwa 24 Stunden.

Wenn Sie versuchen, die Interpretation von Anfragen in natürlicher Sprache zu verwenden, bevor der Datenspeicher bereit ist, ist die Antwort, die Sie erhalten, dieselbe, als wäre filterExtractionCondition auf DISABLED festgelegt.

Suchen und Anfragen in natürlicher Sprache in Filter umwandeln

So suchen Sie mit einer Abfrage in natürlicher Sprache und erhalten Ergebnisse, die für Abfragen in natürlicher Sprache optimiert sind:

REST

Führen Sie den folgenden curl-Befehl aus, mit dem die Methode search aufgerufen wird:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED"
        }
      }'

Ersetzen Sie Folgendes:

PROJECT_ID: die ID Ihres Projekts in Google Cloud .
APP_ID: die ID der Vertex AI Search-Anwendung, die Sie abfragen möchten. Die App muss mit einem Datenspeicher verbunden sein, der strukturierte Daten enthält. Die App darf keine zusammengeführte Such-App sein.
QUERY: Die in natürlicher Sprache formulierte Anfrage.

Beispielbefehl und Teilergebnis

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED"}
}'

{
"results": [
{
  "id": "b2617d862",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
    ...
  }
},
{
  "id": "a51841841",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
    ...
  }
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(amenities: ANY(\"Pets Allowed\") AND amenities: ANY(\"Wifi\") AND star_rating: >= 4 AND price: < 300)",
"extractedFilterStructured": {
  "expression": {
    "andExpr": {
      "expressions": [
        {
          "numberConstraint": {
            "fieldName": "star_rating",
            "value": 4,
            "comparison": "GREATER_THAN_EQUALS",
          }
        },
        {
          "numberConstraint": {
            "fieldName": "price",
            "value": 300,
            "comparison": "LESS_THAN",
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Pets Allowed"]
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Wifi"]
          }
        },
      ]
    }

Suche, bei der Standorte in Anfragen in Filter zur Standortbestimmung umgewandelt werden

So suchen Sie mit einer Abfrage in natürlicher Sprache und erhalten Ergebnisse, die für Abfragen in natürlicher Sprache optimiert sind, einschließlich der Nähe zu Orten:

REST

Führen Sie den folgenden curl-Befehl aus, mit dem die Methode search aufgerufen wird:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "geoSearchQueryDetectionFieldNames": ["GEO_FIELD_NAME_1", "GEO_FIELD_NAME_N"]"
        }
      }'

Ersetzen Sie Folgendes:

PROJECT_ID: die ID Ihres Projekts in Google Cloud .
APP_ID: die ID der Vertex AI Search-Anwendung, die Sie abfragen möchten. Die App muss mit einem Datenspeicher verbunden sein, der strukturierte Daten enthält. Die App darf keine zusammengeführte Such-App sein.
QUERY: Die in natürlicher Sprache formulierte Anfrage.
GEO_FIELD_NAME_1, GEO_FIELD_NAME_N: eine Liste von Werten des Typs geolocation. Wenn der Werttyp nicht geolocation ist, wird dieses Feld ignoriert.

Beispielbefehl und -ergebnis

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a chic and stylish hotel with at least 4 stars that is in San Francisco.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED",
  "geoSearchQueryDetectionFieldNames": ["location"]}
}'

{
"results": [
{
"id": "b2617d862",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
...
}
},
{
"id": "a51841841",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
...
}
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(star_rating: >= 4 AND GEO_DISTANCE("location", "San Francisco", 10000))",
"extractedFilterStructured": {
"expression": {
"andExpr": {
  "expressions": [
    {
      "numberConstraint": {
        "fieldName": "star_rating",
        "value": 4,
        "comparison": "GREATER_THAN_EQUALS",
      }
    },
    {
      "geolocationConstraint": {
        "fieldName": "location",
        "address": "San Francisco",
        "radius_in_meters": 10000,
      }
    },
  ]
}

Mit dem Weichzeichnerfilter suchen

So wenden Sie einen weichen Filter an:

REST

App-ID suchen. Wenn Sie Ihre App-ID bereits haben, fahren Sie mit dem nächsten Schritt fort.
1. Rufen Sie in der Google Cloud Console die Seite KI-Anwendungen auf.
  
  Gehen Sie zu Apps
2. Suchen Sie auf der Seite Apps nach dem Namen Ihrer App und entnehmen Sie die App-ID der Spalte ID.

Führen Sie den folgenden curl-Befehl aus, mit dem die Methode search aufgerufen wird:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

Ersetzen Sie Folgendes:

PROJECT_ID: die ID Ihres Projekts in Google Cloud .
APP_ID: Die ID Ihrer Suchanwendung. Die Anwendung muss mit einem Datenspeicher verbunden sein, der strukturierte Daten enthält. Die App darf keine zusammengeführte Suchanwendung sein.
QUERY: Ihre Anfrage in natürlicher Sprache.

Beispielbefehl und Teilantwort

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search" \
  -d '{
        "query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

{
  "results": [
    {
      "id": "4246fcb660e398908bcd3007d9863ef8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/4246fcb660e398908bcd3007d9863ef8",
        "id": "4246fcb660e398908bcd3007d9863ef8",
        "structData": {
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "available_date": "2023-11-14",
          "amenities": [
            "Pet Friendly",
            "Pool",
            "Free Wi-Fi",
            "Bar"
          ],
          "location": {
            "zip_code": "23941",
            "country": "USA",
            "city": "South Amber",
            "state": "NH",
            "address": "2304 Nicholas Fort, Moorechester, MI 20090"
          },
          "id": 262,
          "contact": {
            "email": "eric59@example.com",
            "phone": "316-868-8020x2693"
          },
          "price_per_night": 112.48,
          "title": "Houston-Tran",
          "rating": 1.5
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true"
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.7236669,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.id",
            "value": 262
          },
          {
            "name": "c.rating",
            "value": 1.5
          },
          {
            "name": "c.price_per_night",
            "value": 112.48
          }
        ]
      }
    },
    {
      "id": "d729812e97b224b7a812e9ad0240ca3e",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/d729812e97b224b7a812e9ad0240ca3e",
        "id": "d729812e97b224b7a812e9ad0240ca3e",
        "structData": {
          "location": {
            "address": "38107 Mays Extension Apt. 070, Steventon, DC 31453",
            "state": "MA",
            "country": "USA",
            "zip_code": "25856",
            "city": "New Laura"
          },
          "title": "Serrano, Jackson and Carr",
          "available_date": "2024-04-05",
          "room_types": [
            "Single",
            "Deluxe",
            "Single"
          ],
          "price_per_night": 188.87,
          "contact": {
            "email": "knavarro@example.com",
            "phone": "(089)882-8916"
          },
          "id": 66,
          "rating": 4.3,
          "amenities": [
            "Pet Friendly",
            "Gym",
            "Pool",
            "Free Wi-Fi"
          ]
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0,
          "clearbox_escorer_score": 0.76363050937652588
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.7108109,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.id",
            "value": 66
          },
          {
            "name": "c.rating",
            "value": 4.3
          },
          {
            "name": "c.price_per_night",
            "value": 188.87
          }
        ]
      }
    },
    {
      "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/67e4484d2e6bf30bd3aa5229058cf3ad",
        "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
        "structData": {
          "rating": 4.6,
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "title": "Spencer-Small",
          "id": 249,
          "amenities": [
            "Pet Friendly",
            "Free Wi-Fi",
            "Pet Friendly",
            "Restaurant"
          ],
          "price_per_night": 66.38,
          "contact": {
            "phone": "+1-176-057-5439x71337",
            "email": "mike26@example.com"
          },
          "location": {
            "zip_code": "37354",
            "state": "WY",
            "city": "Port James",
            "address": "52979 Linda Orchard, New Ashley, GA 22405",
            "country": "USA"
          },
          "available_date": "2024-04-10"
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.71184474,
        "boostingFactor": 0,
        "defaultRank": 3,
        "customSignals": [
          {
            "name": "c.id",
            "value": 249
          },
          {
            "name": "c.rating",
            "value": 4.6
          },
          {
            "name": "c.price_per_night",
            "value": 66.38
          }
        ]
      }
    },
    ...
    {
      "id": "53d468f88b0d87b29bff51f8784d91a8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/53d468f88b0d87b29bff51f8784d91a8",
        "id": "53d468f88b0d87b29bff51f8784d91a8",
        "structData": {
          "contact": {
            "email": "bradley29@example.com",
            "phone": "404.120.7687x62482"
          },
          "price_per_night": 68.66,
          "rating": 3.3,
          "amenities": [
            "Restaurant",
            "Bar",
            "Pet Friendly",
            "Pool"
          ],
          "id": 25,
          "room_types": [
            "Suite",
            "Suite",
            "Double"
          ],
          "available_date": "2024-05-15",
          "title": "Wilson-Ward",
          "location": {
            "city": "East Sheila",
            "country": "USA",
            "state": "TX",
            "zip_code": "34921",
            "address": "60458 Fleming Freeway, South Holly, ME 64008"
          }
        },
        "derivedStructData": {
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.70549995,
        "boostingFactor": 0,
        "defaultRank": 49,
        "customSignals": [
          {
            "name": "c.id",
            "value": 25
          },
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.price_per_night",
            "value": 68.66
          }
        ]
      }
    },
    {
      "id": "653c16be81e88e23d694db625e474881",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/653c16be81e88e23d694db625e474881",
        "id": "653c16be81e88e23d694db625e474881",
        "structData": {
          "price_per_night": 443.9,
          "amenities": [
            "Pool",
            "Free Wi-Fi",
            "Parking",
            "Beach Access"
          ],
          "contact": {
            "email": "jamesblackburn@example.com",
            "phone": "155.107.3771"
          },
          "available_date": "2024-02-25",
          "id": 279,
          "room_types": [
            "Deluxe",
            "Penthouse",
            "Single"
          ],
          "title": "Wolf, Williams and Jenkins",
          "rating": 3.1,
          "location": {
            "address": "904 Kimberly Alley, Lake Aprilchester, WI 31242",
            "zip_code": "23652",
            "state": "SD",
            "country": "USA",
            "city": "Cunninghamside"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.76363050937652588,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.69835776,
        "boostingFactor": 0,
        "defaultRank": 50,
        "customSignals": [
          {
            "name": "c.id",
            "value": 279
          },
          {
            "name": "c.rating",
            "value": 3.1
          },
          {
            "name": "c.price_per_night",
            "value": 443.9
          }
        ]
      }
    }
  ],
  "totalSize": 106,
  "attributionToken": "mAL0FwEKDAiJ_4nIBhDH28e5ARIkNjkwMzk4ODktMDAwMC0yNGQ4LWJmYzEtMTRjMTRlZjFiNjcwIgdHRU5FUklDKkiVksUwjr6dFZ_Wty27kfoxvpH6MbaqojKugJM34-uQN9PaiTeQ97IwwvCeFdSynRXg65A3nNa3Lbe3jC2OkckwuaqiMtDaiTcwAVKMAXByb2plY3RzLzc1NjIwNjYwODQ3OS9sb2NhdGlvbnMvZ2xvYmFsL2NvbGxlY3Rpb25zL2RlZmF1bHRfY29sbGVjdGlvbi9lbmdpbmVzL2hvdGVscy1tYW55LXNlYXJjaF8xNzI0NDUyMzYwMzU2L3NlcnZpbmdDb25maWdzL2RlZmF1bHRfc2VhcmNo",
  "nextPageToken": "AzN2IWMmVGNxMGNx0SMjZmYtgDZ0ITLwADMw0CO4gTOzATO2QiGC8O-7WMEGgcmorICMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
    "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {},
  "naturalLanguageQueryUnderstandingInfo": {
    "extractedFilters": "(rating\u003e=4 AND price_per_night\u003c300 AND amenities: ANY(\"Pet Friendly\") AND amenities: ANY(\"Free Wi-Fi\"))",
    "structuredExtractedFilter": {
      "expression": {
        "andExpr": {
          "expressions": [
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Pet Friendly"
                ],
                "querySegment": "lets me bring my dog"
              }
            },
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Free Wi-Fi"
                ],
                "querySegment": "free Wi Fi"
              }
            },
            {
              "numberConstraint": {
                "fieldName": "rating",
                "comparison": "GREATER_THAN_EQUALS",
                "value": 4
              }
            },
            {
              "numberConstraint": {
                "fieldName": "price_per_night",
                "comparison": "LESS_THAN",
                "value": 300
              }
            }
          ]
        }
      }
    }
  }
}

Mit diesem Beispielbefehl wird das Filterverhalten auf SOFT_BOOST festgelegt und damit der Standardwert HARD_FILTER überschrieben.

Felder für Anfragen in natürlicher Sprache angeben

Damit ein Feld als Filter bei der Auswertung von Anfragen in natürlicher Sprache verwendet werden kann, muss es im Schema als indexierbar gekennzeichnet sein. Allgemeine Informationen zum Ansehen und Bearbeiten eines Schemas finden Sie unter Schema aktualisieren.

Vertex AI Search ermittelt, welche der indexierbaren Felder im Schema für Filter zum Verarbeiten von Suchanfragen in natürlicher Sprache verwendet werden können. Wenn jedoch Felder enthalten sind, die Sie nicht möchten, müssen Sie eine Zulassungsliste erstellen, um anzugeben, welche Felder verwendet werden dürfen.

Nehmen wir als Beispiel eine Hotelbuchungswebsite mit Feldern wie amenities, id, price_per_night, rating und room_types. Wenn id eine Zeichenfolge aus Buchstaben und Zahlen ist, wird sie von Vertex AI Search wahrscheinlich aus den Feldern ausgeschlossen, die zum Verarbeiten von Anfragen in natürlicher Sprache verwendet werden.

Wenn Sie jedoch feststellen, dass Vertex AI Search Suchergebnisse von schlechter Qualität zurückgibt, weil Felder nicht ausgeschlossen werden, die ausgeschlossen werden sollten, müssen Sie angeben, welche Felder verwendet werden können. Wenn das Hotelschema beispielsweise ein Feld für renovation_status enthält, das für Kunden nicht nützlich ist und für die Hotelkette peinlich sein könnte, können Sie es aus der Liste der zulässigen Felder ausschließen.

Beispiel für einen Datensatz aus dem Datenspeicher für strukturierte Daten mit Hoteldaten.

{
  "title": "Miller-Jones",
  "rating": 1.7,
  "price_per_night": 115.16,
  "id": 2902,
    …
  ],
  "amenities": [
    "Spa",
    "Parking",
    "Restaurant"
    …
  ],
  "renovation_status": "Restaurant and spa renovation planned for 2027"
}

Eine geeignete Zulassungsliste für Felder in diesem Beispiel wäre ["amenities", "price_per_night", "rating", "title"]. In der Liste fehlt renovation_status.

So geben Sie eine Zulassungsliste von Feldern an, die in einer Abfrage in natürlicher Sprache verwendet werden können:

REST

App-ID suchen. Wenn Sie Ihre App-ID bereits haben, fahren Sie mit dem nächsten Schritt fort.
1. Rufen Sie in der Google Cloud Console die Seite KI-Anwendungen auf.
  
  Gehen Sie zu Apps
2. Suchen Sie auf der Seite Apps nach dem Namen Ihrer App und entnehmen Sie die App-ID der Spalte ID.

Führen Sie den folgenden curl-Befehl aus, mit dem die Methode search aufgerufen wird:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["FIELD_1", "FIELD_2"],
    }
  }'

Ersetzen Sie Folgendes:

PROJECT_ID: die ID Ihres Projekts in Google Cloud .
APP_ID: Die ID Ihrer Suchanwendung. Die Anwendung muss mit einem Datenspeicher verbunden sein, der strukturierte Daten enthält. Die App darf keine zusammengeführte Suchanwendung sein.
QUERY: Ihre Anfrage in natürlicher Sprache.
FIELD_N: Ein indexierbares Feld im Schema, das für das Verständnis von Anfragen in natürlicher Sprache verwendet werden kann.

Beispielbefehl und Teilantwort

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
  -H "Content-Type: application/json"
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
  -d '{
        "query": "A hotel with beach access for less than $150 a night.",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["amenities", "price_per_night", "rating"]
        }
  }'

{
  "results": [
    {
      "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/8dbf32e3e8d289c30a7c70bf4ba68bac",
        "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
        "structData": {
          "rating": 3.2,
          "location": {
            "city": "Jessicastad",
            "country": "USA",
            "zip_code": "18285",
            "state": "IA",
            "address": "552 Martin Gateway Apt. 964, Christinebury, OR 41179"
          },
          "contact": {
            "phone": "001-446-555-2265x7190",
            "email": "edwardscameron@example.com"
          },
          "amenities": [
            "Parking",
            "Beach Access",
            "Spa"
          ],
          "room_types": [
            "Double",
            "Deluxe",
            "Single"
          ],
          "id": 59,
          "title": "Williams, Richmond and Williams",
          "price_per_night": 143,
          "available_date": "2025-06-06"
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0.77886492013931274,
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.71246886,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.2
          },
          {
            "name": "c.id",
            "value": 59
          },
          {
            "name": "c.price_per_night",
            "value": 143
          }
        ]
      }
    },
    ...
    {
      "id": "fd5f0b4125a9c52420510aa1aa52eaff",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/fd5f0b4125a9c52420510aa1aa52eaff",
        "id": "fd5f0b4125a9c52420510aa1aa52eaff",
        "structData": {
          "amenities": [
            "Beach Access",
            "Spa",
            "Gym",
            "Pet Friendly"
          ],
          "room_types": [
            "Queen",
            "King",
            "Suite"
          ],
          "id": 277,
          "title": "Wyatt, Thomas and Price",
          "available_date": "2023-11-17",
          "contact": {
            "phone": "9745551788",
            "email": "shermandaniel@example.com"
          },
          "rating": 3.3,
          "price_per_night": 139.18,
          "location": {
            "address": "05952 Elaine Freeway, Lake Timothychester, MD 69485",
            "country": "USA",
            "state": "DC",
            "city": "North Marcusmouth",
            "zip_code": "23129"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.77886492013931274,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.7304497,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.id",
            "value": 277
          },
          {
            "name": "c.price_per_night",
            "value": 139.18
          }
        ]
      }
    }
  ],
  "totalSize": 17,
  "attributionToken": "lwL0FgEKCwj__drHBhCzzZdSEiQ2OTAwYTgzZC0wMDAwLTI5YzYtYjliMi03NDc0NDYzYjVjY2QiB0dFTkVSSUMqSJWSxTCQ97IwwvCeFZ_Wty25qqIy0NqJN9PaiTeugJM31LKdFY6-nRWc1rct4-uQN7e3jC2-kfoxjpHJMLuR-jG2qqIy4OuQNzABUowBcHJvamVjdHMvNzU2MjA2NjA4NDc5L2xvY2F0aW9ucy9nbG9iYWwvY29sbGVjdGlvbnMvZGVmYXVsdF9jb2xsZWN0aW9uL2VuZ2luZXMvaG90ZWxzLW1hbnktc2VhcmNoXzE3MjQ0NTIzNjA3NTYvc2VydmluZ0NvbmZpZ3MvZGVmYXVsdF9zZWFyY2g",
  "nextPageToken": "Q2YjVjYzYDN0cDN30iMiljYtYzY5ITLwADMw0yYzgTYwATO2QiGB0ZxBPIEGcs6m_PCMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
  "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {}
}

Mit diesem Beispielbefehl können die Felder amenities, price_per_night und rating in Filtern für Anfragen in natürlicher Sprache verwendet werden.

Mit Natural Language Understanding filtern Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Interpretation von Anfragen in natürlicher Sprache

Harte und weiche Filter

Beispiele

Beispiel: Felder aus Abfragen extrahieren (Hard Filter)

Beispiel: Mit einem Geolocation-Filter (Hard-Filter)

Beispiel: Felder aus Abfragen extrahieren (weicher Filter)

Beschränkungen

Hinweis

REST

Beispiel für Befehl und Antwort

Suchen und Anfragen in natürlicher Sprache in Filter umwandeln

REST

Beispielbefehl und Teilergebnis

Suche, bei der Standorte in Anfragen in Filter zur Standortbestimmung umgewandelt werden

REST

Beispielbefehl und -ergebnis

Mit dem Weichzeichnerfilter suchen

REST

Beispielbefehl und Teilantwort

Felder für Anfragen in natürlicher Sprache angeben

REST

Beispielbefehl und Teilantwort

Mit Natural Language Understanding filtern