Feldeinstellungen konfigurieren

Auf dieser Seite erfahren Sie, wie Sie die Schemafelder konfigurieren, um eine App für strukturierte Daten, unstrukturierte Daten mit Metadaten oder Websitedaten mit benutzerdefinierten, strukturierten Attributen einzurichten.

Mit den Feldeinstellungen wird festgelegt, wie Agent Search die Felder in den Ergebnissen verwendet. In derGoogle Cloud Console können Sie auf dem Tab Schema die Feldeinstellungen konfigurieren.

Die Feldeinstellungen können nur für Apps mit Datenspeichern konfiguriert werden, die strukturierte Daten oder unstrukturierte Daten mit Metadaten enthalten.

Feldeinstellungen

Die folgenden Feldeinstellungen sind für viele Feldtypen in Ihren Such- oder Empfehlungsdaten verfügbar, aber nicht für alle Datentypen. Ein Schema enthält mehrere Feldeinstellungen für einzelne Felder. In der folgenden Tabelle finden Sie Einstellungen, die auf ein Feld in einem Schema angewendet werden können. Die Verwendung strukturierter Daten wird für diese Feldeinstellungen dringend empfohlen:

Einstellung Definition Zweck Beispiel für einen Anwendungsfall
Indexierbar

Wenn Sie Felder als indexierbar festlegen, können Sie Vorgänge wie Filtern, Verstärken und Facettieren für strukturierte Felder in einem Dokument ausführen.

Felder vom Typ Object können nicht auf Indexable gesetzt werden.

Wenn Sie ein Feld als Indexable markieren, können Sie schneller danach suchen.

Wenn Sie ein Feld als Indexable markieren, wird der Suchindex größer und die Indexierung kann langsamer werden.

In einem Hoteldatenspeicher können Sie ein Feld wie hotel_chain als indexierbar festlegen. So können Sie Ranking-, Filter- und Boosting-Vorgänge auf hotel_chain anwenden. Sie können beispielsweise einen Filter anwenden, damit in den Suchergebnissen nur die gefilterte Hotelkette angezeigt wird.
Suchbar

Felder, die am wahrscheinlichsten mit Suchanfragen in Verbindung stehen, werden als Searchable gekennzeichnet. Ein Feld kann durchsuchbar sein, ohne indexierbar oder abrufbar zu sein.

Nur Felder mit Textwerten können als suchbar markiert werden. Ein numerisches Preisfeld kann also indexierbar sein (zum Filtern oder Facettieren), aber nicht als Volltext durchsucht werden.

Wenn Sie ein Feld auf Suchbar setzen, wird der Recall-Wert für dieses Feld in Suchanfragen verbessert. Nutzer können dann Inhalte wie Webseiten finden, indem sie den Text in diesen Feldern abfragen. Wenn Sie ein Feld als suchbar markieren, kann es für das Ranking verwendet werden. Wenn Sie eine übermäßige Anzahl von Feldern als durchsuchbar markieren, kann dies die Genauigkeit der Suche beeinträchtigen, da der Ranking-Algorithmus überlastet wird und zu viele Ergebnisse zurückgegeben werden. Das kann zu irrelevanten Suchergebnissen führen.

Sie können eine relative Gewichtung auf durchsuchbare Felder anwenden. Aufgrund der robusten Standardeinstellungen ist dies jedoch selten erforderlich. Weitere Informationen finden Sie unten unter Suchfelder gewichten.

Im Support-Ticketsystem eines Internetanbieters wird jedes Ticket als strukturiertes Dokument gespeichert. Wenn diese Dokumente durchsuchbare Textfelder wie issue_description oder resolution_notes enthalten, kann ein Kundenservicemitarbeiter eine Anfrage zum Inhalt dieser Felder stellen, z. B. Wie kann ich langsame Internetgeschwindigkeiten nach dem Zurücksetzen des Modems beheben?. Das System würde dann die Dokumente anzeigen, die einen dieser Suchbegriffe enthalten, z. B. Modem, Internet oder Geschwindigkeit, entweder in einem oder beiden Feldern issue_description oder resolution_notes.

Präfixabgleich möglich
(Vorschau)

Ermöglicht den Abgleich von Textfeldern mit Präfixen mithilfe des Operators STARTS_WITH in Filterausdrücken. Nur Felder vom Typ String oder String Array können auf „Präfix-Abgleich möglich“ gesetzt werden.

Weitere Informationen finden Sie unten unter Felder für Präfix- und Teilabgleich verfügbar machen.

Wenn Sie ein Feld auf „Prefix matchable“ (Mit Präfix abgleichbar) setzen, kann die Suchmaschine Suchstrings abgleichen, die Präfixe des Feldwerts sind. Das ist besonders nützlich für den Abgleich hierarchischer Kennungen, Pfade oder Codes, bei denen der Anfang des Strings bekannt ist. Der Präfixabgleich ist auf die ersten 12 Zeichen des normalisierten Feldwerts beschränkt und erhöht die Größe des Suchindex. Sie können nicht mehr als 10 Felder als „Prefix matchable“ festlegen.

Sie haben ein Feld, ticket_id, das ein Format wie <country-code><city-code><number> verwendet. Beispiele sind UKLON100, UKMAN100, UKMAN101 und USNY200. Wenn Sie alle Tickets aus Manchester (Vereinigtes Königreich) finden möchten, können Sie das Feld ticket_id als Präfix-abgleichbar festlegen und dann den Filter ticket_id: STARTS_WITH("UKMAN") verwenden. Dieser gibt UKMAN100 und UKMAN101 zurück.

Teilweise abgleichbar
(Vorschau)

Ermöglicht den Teilstring-Abgleich für Textfelder mit dem Operator CONTAINS in Filterausdrücken. Nur Felder vom Typ String oder String Array können auf „Teilweise abgleichbar“ gesetzt werden.

Weitere Informationen finden Sie unten unter Felder für Präfix- und Teilabgleich verfügbar machen.

Wenn Sie ein Feld auf „Teilweise abgleichbar“ festlegen, ist ein tokenbasierter Abgleich innerhalb des Felds möglich. Nutzer können dann Inhalte finden, wenn nur ein Teil des Feldwerts bekannt ist. Die Suchmaschine vergleicht Abfragetokens mit Tokens im Feldwert, unabhängig von ihrer Reihenfolge. Wenn Sie ein Feld als teilweise abgleichbar kennzeichnen, erhöht sich die Größe des Suchindex. Sie können maximal 10 Felder als teilweise abgleichbar festlegen.

Sie möchten nach Regionen in Europa filtern. Die Namen region umfassen Central Europe und Eastern Europe. Wenn Ihr Filter region: ANY("Europe") ist, erhalten Sie keine Übereinstimmungen. Wenn das Feld region jedoch als teilweise übereinstimmend festgelegt ist, können Sie mit region: CONTAINS("Europe") filtern und Übereinstimmungen für Central Europe und Eastern Europe erhalten.

Als dynamisches Attribut verwendbar Bietet kontextbezogene Filter, um die Suche für Nutzer besser auszurichten. Wenn Sie ein Feld als Dynamic Facetable festlegen, kann das System automatisch interaktive Filter (Faceted Search) basierend auf den eindeutigen Werten im Feld generieren. Wenn Sie ein Feld auf Dynamic facetable setzen, können Nutzer Suchergebnisse dynamisch verfeinern, indem sie Kategorien oder Attribute auswählen, die direkt aus Ihren aufgenommenen Daten abgeleitet werden. Sie müssen also nicht jede mögliche Filteroption manuell vordefinieren. So können Nutzer ihre Suche auf sehr spezifische Webinhalte eingrenzen.
Verwenden Sie Dynamic Facetable zusammen mit Searchable, um bessere Ergebnisse zu erzielen. Dadurch werden sowohl der Recall Ihrer Suche als auch die Qualität der dem Nutzer angebotenen Facetten verbessert.
Seiten in einer internen Unternehmenswissensdatenbank, z. B. Personalrichtlinien, werden mit Daten wie department, document_type oder last_modified_date aufgenommen. Wenn diese Felder mit dynamic facetable gekennzeichnet sind, werden bei einer Mitarbeitersuche nach einem Begriff wie Kostenerstattung dynamisch interaktive Filter basierend auf den relevanten Ergebnissen generiert. In diesem Fall könnten in der Weboberfläche Facetten für Abteilung: Finanzen, Reisen, Dokumenttyp: Richtlinie, FAQs oder Datum der letzten Änderung: Dieses Quartal, Letztes Jahr angezeigt werden.
Abrufbar Wenn eine Suchanfrage auf übereinstimmende Inhalte trifft, kann die Suchmaschine die Werte der abrufbaren Felder abrufen, um sie anzuzeigen oder in der Anwendung zu verwenden. Das bedeutet, dass Informationen aus dem Originaldokument als Teil der Suchergebnisse angezeigt werden. Schlüsselfelder (eindeutige Kennungen für Dokumente) sind als abrufbar eingerichtet. Abrufbare Felder bieten Suchkontext, indem sie Felder unterscheiden, deren Werte angezeigt werden können, von Feldern, die nur in der Suchlogik verwendet werden sollen, deren Rohwerte aber nicht für den Endnutzer sichtbar sein sollen. Bei einer Produktsuche auf einer Händlerwebsite sind product_id, name, price und image_url typische Felder, die Sie als abrufbar festlegen sollten. Andererseits kann die internal_tracking_code nur für administrative Zwecke indexiert und gefiltert werden, aber nicht in öffentlichen Suchergebnissen abrufbar sein.
Vervollständigbar Ermöglicht die Verwendung des Inhalts eines Felds für Vorschläge für Suchanfragen. Weitere Informationen finden Sie unter Automatische Vervollständigung konfigurieren.

Mit dieser Einstellung können Werte in diesem Feld verwendet werden, um Nutzern während der Eingabe Suchvorschläge in Echtzeit zu präsentieren. Diese Funktion hilft Nutzern, relevante Inhalte zu finden, und beschleunigt den Suchvorgang. Bestimmte Faktoren wie die Verwendung von Filtern in natürlicher Sprache können sich auf die Leistung auswirken.

Wenn das Feld completable für product_name, brand und category festgelegt ist und der Nutzer Tech eingibt, können die Vorschläge für die automatische Vervollständigung Folgendes enthalten:
  • TechCo (aus dem Feld brand)
  • TechCo UltraBook X1 (aus dem Feld product_name)
  • Technologie GameMaster Pro (ein anderes Produkt aus dem Feld category)
Filterbar Ermöglicht es, Empfehlungen anhand eines Felds zu filtern, um festzulegen, welche Suchergebnisse Ihren Nutzern angezeigt werden. Informationen zum Filtern von Empfehlungen finden Sie unter Empfehlungen filtern. Wenn Sie ein Feld auf Filterable setzen, können Sie Empfehlungen für Nutzer anpassen. Es gelten Filterlimits. Eine Filtereinstellung nach Sprache und Drama könnte so aussehen: language_code: ANY("en", "fr") OR categories: ANY("drama").

Unterschiede zwischen häufig verwendeten Einstellungen

Es gibt wichtige Unterschiede zwischen den Feldeinstellungen „Indexierbar“, „Suchbar“ und „Abrufbar“. In der Tabelle sind diese Unterschiede zusammengefasst.

Funktion Indexierbar Suchbar Abrufbar
Primäre Rolle Stellt Feldinhalte für Suchmaschinen zur Verfügung Ermöglicht die Volltextsuche im Feldinhalt Ermöglicht, dass der Wert des Felds in den Suchergebnissen zurückgegeben wird.
Analyse Inhalte werden verarbeitet und in einen Index aufgenommen. Unterzieht sich in der Regel einer umfangreichen lexikalischen Analyse. Der Wert wird unverändert zur Anzeige gespeichert.
Kann es sein, dass…
…suchbar? Ja (oft eine Voraussetzung) Nicht unbedingt (kann abrufbar sein, ohne durchsuchbar zu sein)
…abrufbar? Nicht unbedingt Nicht unbedingt
…Filterbar/Sortierbar/Als Attribut verwendbar? Ja (in der Regel auch eine Voraussetzung für diese) Nicht direkt. Das sind separate Attribute, die oft auf einem indexierbaren Feld basieren. Nicht direkt. Diese Attribute beziehen sich darauf, wie das Feld indexiert und abgefragt wird, nicht nur darauf, wie es angezeigt wird.

In der Praxis sind viele Felder, die für die Nutzerfreundlichkeit entscheidend sind (z. B. Titel, Beschreibungen und personenidentifizierbare Informationen), oft auf indexable, searchable und retrievable festgelegt.

Beschränkungen

Für Feldeinstellungen gelten die folgenden Einschränkungen:

  • Sie können bis zu 50 Felder als indexierbar, suchbar, abrufbar oder „Als dynamisches Attribut verwendbar“ konfigurieren.
  • Wenn ein Feld als dynamisches Attribut konfiguriert werden soll, muss es zuerst als indexierbar konfiguriert werden.
  • Wenn Sie die indexierbare Einstellung ändern, müssen die Daten neu indexiert werden. Dies kann insbesondere bei großen Datenspeichern Stunden dauern.

Wenn Sie Felder für eine App zur Mediensuche konfigurieren und detaillierte Informationen zu den Feldern im Schema benötigen, lesen Sie den Abschnitt Mediendokumente und Datenspeicher.

Feldeinstellungen aktualisieren

So aktualisieren Sie die Feldeinstellungen:

  1. Rufen Sie in der Google Cloud Console die Seite KI-Anwendungen auf.

    KI-Anwendungen

  2. Klicken Sie auf den Namen der App, die Sie bearbeiten möchten.

  3. Klicken Sie auf Daten.

  4. Klicken Sie auf den Tab Schema. Auf diesem Tab werden die aktuellen Feldeinstellungen angezeigt.

    Der Tab Schema wird nicht angezeigt, wenn Ihr Datenspeicher einfache Websitedaten oder unstrukturierte Daten ohne Metadaten enthält.

  5. Klicken Sie auf Bearbeiten.

  6. Wählen Sie die Feldeinstellungen aus, die Sie aktualisieren müssen, oder heben Sie die entsprechende Auswahl auf. Einige Feldeinstellungen werden nicht unterstützt. Numerische Felder können beispielsweise nicht auf Suchbar festgelegt werden.

  7. Klicken Sie auf Speichern, um die Änderungen zu übernehmen.

Wenn Sie ein Feld als durchsuchbar markieren, können Sie ein Gewicht angeben, um seine relative Bedeutung in den Suchergebnissen anzugeben. In den meisten Fällen müssen Sie keine Gewichte für einzelne Felder angeben, da die Standardgewichte gut funktionieren.

In einigen Situationen kann es jedoch erforderlich sein, die Gewichte anzupassen, z. B.:

  • Sie migrieren Daten von einer vorhandenen Suchplattform, auf der bereits gewichtete Felder verwendet werden.

  • Wenn die Standardgewichte keine zufriedenstellenden Suchergebnisse liefern. Das kann insbesondere dann passieren, wenn Sie viele durchsuchbare Felder haben und einige davon deutlich wichtiger sind als andere.

    Vielleicht ist die Zusammenfassung das wichtigste Feld für Suchanfragen und Sie möchten diesen Text priorisieren.

    Oder das Schema enthält ein Feld mit hochrelevanten Keywords, die sich hervorragend für die Vorhersage von Suchergebnissen eignen. Da dieses Feld jedoch viel kürzer als andere ist, wird sein Einfluss oft von längeren Feldern überschattet. Wenn Sie das Gewicht erhöhen, wird die beabsichtigte Wirkung erzielt.

Gewichtsklassen

Die Gewichte werden in die folgenden Stufen eingeteilt:

Wichtigkeit von Feldern Erklärung
Sehr niedrig Ein niedriger Wert, der vom System weiterhin berücksichtigt wird, wenn es die Werte aus allen Feldern kombiniert. Wenn Sie noch weniger Gewichtung wünschen, sodass der Effekt vernachlässigbar ist, markieren Sie das Feld nicht als durchsuchbar.
Niedrig Eine Gewichtung, die niedriger als der Standardwert ist.
Default Das Standardgewicht für durchsuchbare Felder. Dieses Gewicht bietet in den meisten Fällen eine angemessene Leistung.
Hoch Ein Gewicht, das deutlich höher als der Standardwert ist.
Sehr hoch Ein dominierendes Gewicht. In der Regel reservieren Sie diese Option für maximal ein Feld.

Schemaaktualisierung und Neuindexierung

Wenn Sie durchsuchbaren Feldern Gewichte hinzufügen möchten, müssen Sie das Schema aktualisieren und die Daten im Datenspeicher neu indexieren. Die Aktualisierung des Schemas dauert Stunden. Es gibt keinen zuverlässigen Indikator dafür, wann die Indexierung abgeschlossen ist. Sie müssen die Indexierungszeit also überschätzen.

Gewichtungsstufen für Felder festlegen

Das Festlegen von Gewichtungsstufen für Felder kann mühsam sein, da Sie nur kleine Änderungen vornehmen und die Suchergebnisse danach sorgfältig prüfen sollten, um unerwünschte Folgen auszuschließen. Nach jeder Änderung müssen Sie warten, bis die Neuindexierung abgeschlossen ist, bevor Sie die Auswirkungen der Änderung bewerten können.

Sie können die Gewichtung von Suchfeldern nur über die API konfigurieren. Diese Funktion ist in der Google Cloud Console nicht verfügbar.

Wenn Sie Gewichte festlegen möchten, müssen Sie das Schema für den Datenspeicher über die API-Methode projects.locations.dataStores.schemas.patch aktualisieren.

  1. Wenn Sie Ihr Schema noch nicht haben, folgen Sie der Anleitung unter Schemadefinition ansehen.

  2. Aktualisieren Sie das Schema programmatisch. Fügen Sie einem oder mehreren durchsuchbaren Feldern Gewichte hinzu, wie in diesen Beispielen:

    "summary": {
       "type": "string",
       "searchable": true,
       "weight": "high"
     },
     "uri": {
       "type": "string",
       "searchable": true,
       "weight": "low"
     },
    

    In diesem Beispiel wird das Feld summary auf eine höhere Gewichtung als normal und das Feld uri auf eine niedrigere Gewichtung festgelegt. Wenn Sie eine Gewichtung auf den Standardwert zurücksetzen möchten, legen Sie sie auf default fest.

    Zulässige Werte für den Gewichtungsparameter:

    • very_low
    • low
    • default
    • high
    • very_high
  3. Warten Sie, bis die Neuindexierung abgeschlossen ist, und testen Sie dann das Suchverhalten.

Felder für Präfix- und Teilabgleich verfügbar machen (Vorabversion)

Bei Feldern vom Typ string können Sie das Schema bearbeiten, um die Felder für die Präfixübereinstimmung oder die teilweise Übereinstimmung verfügbar zu machen. So können Sie STARTS_WITH oder CONTAINS in Filterausdrücken verwenden.

Schemaaktualisierung und Neuindexierung

Wenn Sie Felder für die Präfix- oder Teilübereinstimmung verfügbar machen möchten, müssen Sie das Schema aktualisieren und die Daten im Datenspeicher neu indexieren. Das Aktualisieren des Schemas dauert Stunden und es gibt keinen zuverlässigen Indikator, der Ihnen anzeigt, wann die Indexierung abgeschlossen ist. Sie müssen die Indexierungszeit daher überschätzen.

Schema für Präfix- und Teilabgleich aktualisieren

Wenn Sie Felder für die Präfix- oder Teilübereinstimmung angeben möchten, müssen Sie das Schema für den Datenspeicher über die API-Methode projects.locations.dataStores.schemas.patch aktualisieren.

  1. Wenn Sie Ihr Schema noch nicht haben, folgen Sie der Anleitung unter Schemadefinition ansehen.

  2. Folgen Sie der Anleitung, um das Schema programmatisch zu aktualisieren. Legen Sie die abgleichbaren Parameter im Schema auf true fest, wie in diesen Beispielen:

    "zone": {
       "type": "string",
       "searchable": true,
       "prefixMatchable": true
     },
     "region": {
       "type": "string",
       "searchable": true,
       "partialMatchable": true
     },
     "model": {
       "type": "string",
       "searchable": true,
       "prefixMatchable": true,
       "partialMatchable": true
     },
    

    In diesem Beispiel ist das Feld zone so festgelegt, dass es mit einem Präfix abgeglichen werden kann. Im Filterausdruck können bis zu 12 Zeichen verwendet werden, bei denen die Groß-/Kleinschreibung nicht beachtet wird, um den Feldwert abzugleichen. Das Feld region ist auf „teilweise abgleichbar“ gesetzt.

  3. Warten Sie, bis die Neuindexierung abgeschlossen ist.

Details zum Präfixabgleich

Mit der Präfixübereinstimmung in der Agent-Suche können Sie Ergebnisse danach filtern, ob der Wert eines Felds mit einem bestimmten String beginnt. Diese Funktion basiert auf dem Operator STARTS_WITH und erfordert, dass das Zieltextfeld im Schema als prefixMatchable konfiguriert ist.

Normalisierungs- und Abgleichslogik

Zur Optimierung der Leistung und zur Gewährleistung der Konsistenz wendet das System einen bestimmten Normalisierungsprozess sowohl auf den Feldwert (bei der Indexierung) als auch auf den Abfragestring (bei der Suche) an.

  1. Umwandlung in Kleinbuchstaben: Alle Zeichen werden in Kleinbuchstaben umgewandelt. Dadurch wird die Groß-/Kleinschreibung beim Abgleich nicht berücksichtigt.

  2. Kürzung auf 12 Zeichen: Das System berücksichtigt nur die ersten 12 Zeichen des Strings. Alle Zeichen, die dieses Limit überschreiten, werden für den Präfixabgleich ignoriert.

Funktionsweise

Beim Indexieren werden für ein Feld, das als prefixMatchable gekennzeichnet ist, Präfix-Tokens für die ersten 12 Zeichen generiert. Für einen Wert wie asia-south1-c werden im Index Tokens für a, as, asi, asia, asia- usw. bis zum 12. Zeichen (asia-south1-) gespeichert.

Zur Abfragezeit wird der für den STARTS_WITH-Operator bereitgestellte String ebenfalls in Kleinbuchstaben umgewandelt und auf 12 Zeichen gekürzt. Die Anfrage wird dann mit den gespeicherten Präfix-Tokens abgeglichen.

Beispiele

Die folgenden Beispiele zeigen, wie sich die Normalisierung auf 12 Zeichen auf die Suchergebnisse auswirkt:

  • Weitgehend passend: STARTS_WITH("A") stimmt mit jedem Wert überein, der mit „a“ beginnt (Groß-/Kleinschreibung wird nicht berücksichtigt), z. B. asia, australia oder africa.

  • Teilpräfixe: STARTS_WITH("asia-south") stimmt sowohl mit asia-south1-a als auch mit asia-southeast1-b überein, da beide mit dem angegebenen 10‑stelligen String beginnen.

  • Kürzung: Da nur die ersten 12 Zeichen berücksichtigt werden, stimmt STARTS_WITH("asia-south1-a") mit dem Feldwert asia-south1-c überein. Das liegt daran, dass beide Strings auf dasselbe 12‑stellige Präfix normalisiert werden: asia-south1-.

Details zum teilweisen Abgleich

Mit der teilweisen Übereinstimmung in der Agentsuche können Sie Ergebnisse filtern, je nachdem, ob der Wert eines Felds bestimmte Wörter oder Tokens enthält. Diese Funktion wird vom Operator CONTAINS unterstützt und erfordert, dass das Zieltextfeld im Schema als partialMatchable konfiguriert ist.

Logik für Normalisierung und Tokenisierung

Bei der Agent-Suche werden sowohl der Feldwert (bei der Indexierung) als auch der Abfragestring (bei der Suche) normalisiert und tokenisiert:

  • Umwandlung in Kleinbuchstaben: Bei Agent Search werden die Zeichen in Kleinbuchstaben umgewandelt. Dadurch wird die Groß-/Kleinschreibung beim Abgleich nicht berücksichtigt.

  • Tokenisierung: Bei der Agent Search wird der String mithilfe von Leerzeichen und anderen Zeichen als Trennzeichen in einzelne Tokens (Wörter) aufgeteilt.

    • Standardtrennzeichen: Leerzeichen und gängige Satzzeichen fungieren als Trennzeichen, darunter Bindestriche (-), Schrägstriche (/), Kommas (,), Punkte (.), Sternchen (*), geschweifte Klammern ({ }), eckige Klammern ([ ]), runde Klammern (( )) und Apostrophe (').

    • Nicht als Trennzeichen verwendete Zeichen: Das kaufmännische Und-Zeichen (&) und der Unterstrich (_) fungieren nicht als Trennzeichen. Zeichen, die durch diese Symbole verbunden sind, werden im System als ein einzelnes Token behandelt.

    • E-Mail-Trennzeichen (@): Das Symbol @ dient als spezielles Trennzeichen, um E-Mail-Adressen zu erkennen. Das System generiert Tokens für die einzelnen Komponenten sowie für kombinierte Formen. Beispiel: support+tier1@example.com wird in support, tier1, example, com, support+tier1@example.com und support@example.com zerlegt.

Funktionsweise

Beim Indexieren wird für ein als partialMatchable gekennzeichnetes Feld der Feldwert normalisiert und in Tokens zerlegt. Die resultierenden Tokens werden im Index gespeichert. Ein Feldwert von 25-meter, outdoor, swimming pool wird beispielsweise in [25, meter, outdoor, swimming, pool] zerlegt.

Zur Abfragezeit wird der für den CONTAINS-Operator bereitgestellte String demselben Normalisierungs- und Tokenisierungsprozess unterzogen. Die Suchmaschine prüft dann, ob alle resultierenden Abfragetokens mit den gespeicherten Tokens für das Feld übereinstimmen. Die Reihenfolge der Tokens spielt keine Rolle.

Beispiele

Die folgenden Beispiele zeigen, wie sich die Tokenisierung auf die Ergebnisse von Teilübereinstimmungen auswirkt:

  • Einfacher Tokenabgleich: Wenn der Feldwert 25-meter, outdoor, swimming pool ist, stimmt ein Filter von CONTAINS("Outdoor pool") überein. Das System tokenisiert die Anfrage in [outdoor, pool], die beide in den Tokens des Felds vorhanden sind.

  • Reihenfolgeunabhängigkeit: Ein Filter von CONTAINS("pool outdoor") stimmt auch mit dem Feldwert 25-meter, outdoor, swimming pool überein, da das System das Vorhandensein jedes Tokens unabhängig von seiner Reihenfolge prüft.

  • Abgleich von E-Mail-Adressen: Wenn in einem Feld die E-Mail-Adresse support+tier1@example.com gespeichert ist, werden Filter wie CONTAINS("support"), CONTAINS("example.com") oder CONTAINS("support@example.com") aufgrund der speziellen Tokenisierung des Symbols @ alle erfolgreich abgeglichen.

Nächste Schritte