Die Suche und Empfehlungen unterstützen die folgenden Sprachen.
Search für den Handel
Unterstützte Sprachen
| Unterstützte Sprachen | |
|---|---|
| Albanisch | Koreanisch |
| Arabisch | Lettisch |
| Armenisch | Litauisch |
| Assamesisch | Mazedonisch |
| Aserbaidschanisch | Malaiisch |
| Baskisch | Marathi |
| Bengalisch (Bangla) | Mongolisch |
| Bulgarisch | Nepalesisch |
| Burmesisch | Norwegisch |
| Katalanisch | Oriya |
| Chinesisch (vereinfacht) | Persisch |
| Chinesisch (traditionell) | Polnisch |
| Kroatisch | Portugiesisch (Europa) |
| Tschechisch | Portugiesisch (Brasilien) |
| Dänisch | Punjabi |
| Niederländisch | Rumänisch |
| Englisch | Russisch |
| Estnisch | Serbisch |
| Finnisch | Serbisch (Kyrillisch) |
| Französisch (Europa) | Singhalesisch |
| Französisch (Kanada) | Slowakisch |
| Georgisch | Slowenisch |
| Deutsch | Spanisch (Europa) |
| Griechisch | Spanisch (Lateinamerika) |
| Gujarati | Suaheli |
| Hebräisch | Schwedisch |
| Hindi | Tamil |
| Ungarisch | Telugu |
| Isländisch | Thailändisch |
| Indonesisch | Türkisch |
| Italienisch | Ukrainisch |
| Japanisch | Urdu (Indien) |
| Kannada | Urdu (Pakistan) |
| Kasachisch | Usbekisch |
| Khmer | Vietnamesisch |
Sie legen die Sprache beim Hochladen Ihres Katalogs für Ihr Vertex AI Search for Commerce-Projekt fest. Der Katalog sollte nur in einer Sprache verfügbar sein und Suchanfragen sollten in derselben Sprache gesendet werden. Wenn der Katalog mehrere Sprachen enthält, wird die LLM-Leistung beeinträchtigt.
Empfehlungen
Die meisten Sprachen werden unterstützt. Das Modell erkennt die Textsprache automatisch.
Unterstützte Sprachen
| Sprache | Skriptname |
|---|---|
| Afrikaans | Latein |
| Amharisch | Äthiopisch |
| Arabisch | Arabisch |
| Bulgarisch | Kyrillisch |
| Bulgarisch | Latein |
| Bengalisch | Bengalisch |
| Bosnisch | Latein |
| Katalanisch | Latein |
| Cebuano | Latein |
| Korsisch | Latein |
| Tschechisch | Latein |
| Walisisch | Latein |
| Dänisch | Latein |
| Deutsch | Latein |
| Griechisch | Griechisch |
| Griechisch | Latein |
| Englisch | Latein |
| Esperanto | Latein |
| Spanisch | Latein |
| Estnisch | Latein |
| Baskisch | Latein |
| Persisch | Arabisch |
| Finnisch | Latein |
| Filipino | Latein |
| Französisch | Latein |
| Westfriesisch | Latein |
| Irisch | Latein |
| Schottisches Gälisch | Latein |
| Galizisch | Latein |
| Gujarati | Gujarati |
| Hausa | Latein |
| Hawaiisch | Latein |
| Hindi | Dewanagari |
| Hindi | Latein |
| Hmong | Latein |
| Kroatisch | Latein |
| Haitianisch | Latein |
| Ungarisch | Latein |
| Armenisch | Armenisch |
| Indonesisch | Latein |
| Igbo | Latein |
| Isländisch | Latein |
| Italienisch | Latein |
| Hebräisch | Hebräisch |
| Japanisch | Japanisch |
| Japanisch | Latein |
| Javanisch | Latein |
| Georgisch | Georgisch |
| Kasachisch | Kyrillisch |
| Khmer | Khmer |
| Kannada | Kannada |
| Koreanisch | Koreanisch |
| Kurdisch | Latein |
| Kirgisisch | Kyrillisch |
| Latein | Latein |
| Luxemburgisch | Latein |
| Lao | Lao |
| Litauisch | Latein |
| Lettisch | Latein |
| Malagasy | Latein |
| Maori | Latein |
| Mazedonisch | Kyrillisch |
| Malayalam | Malayalam |
| Mongolisch | Kyrillisch |
| Marathi | Dewanagari |
| Malaiisch | Latein |
| Maltesisch | Latein |
| Burmesisch | Myanmar |
| Nepalesisch | Dewanagari |
| Niederländisch | Latein |
| Norwegisch | Latein |
| Chichewa | Latein |
| Punjabi | Gurmukhi |
| Polnisch | Latein |
| Paschtu | Arabisch |
| Portugiesisch | Latein |
| Rumänisch | Latein |
| Russisch | Kyrillisch |
| Russisch | Englisch |
| Sindhi | Arabisch |
| Singhalesisch | Singhalesisch |
| Slowakisch | Latein |
| Slowenisch | Latein |
| Samoanisch | Latein |
| Shona | Latein |
| Somali | Latein |
| Albanisch | Latein |
| Serbisch | Kyrillisch |
| Süd-Sotho | Latein |
| Sundanesisch | Latein |
| Schwedisch | Latein |
| Suaheli | Latein |
| Tamil | Tamil |
| Telugu | Telugu |
| Tadschikisch | Kyrillisch |
| Thailändisch | Thailändisch |
| Türkisch | Latein |
| Ukrainisch | Kyrillisch |
| Urdu | Arabisch |
| Usbekisch | Latein |
| Vietnamesisch | Latein |
| Xhosa | Latein |
| Jiddisch | Hebräisch |
| Yoruba | Latein |
| Chinesisch | Han (einschließlich vereinfacht und traditionell) |
| Chinesisch | Latein |
| Zulu | Latein |
Eine Liste aller Sprachen, die automatisch erkannt werden können, finden Sie in der GitHub-README-Datei auf der Seite „Compact Language Detector“.
Sprachnormalisierung und Tokenisierung
Die Commerce-Suchmaschine von Vertex AI Search bietet eine integrierte Verarbeitung chinesischer oder japanischer Zeichen ohne Leerzeichen und normalisiert europäische diakritische Zeichen. Dadurch müssen Sie keine proprietären Vorverarbeitungs-Übersetzungsebenen in Ihre Suchanwendungen einbauen.
- Normalisierung nicht englischer Zeichen: Die Suchmaschine bietet integrierte Unterstützung für UTF-8 und normalisiert automatisch diakritische Zeichen und Umlaute bei der Indexierung und Abfrage (z. B. wird
äaufaoderaeundéaufeabgebildet). So können Nutzer nach cafe suchen und problemlos café finden. - CJK-Tokenisierung (Kanji und Katakana): Bei chinesischen, japanischen und koreanischen (CJK) Sprachen wird die Tokenisierung nicht durch Leerzeichen bestimmt. Dabei werden wörterbuchbasierte Segmentierer und morphologische Analysatoren verwendet, um Zeichenfolgen aus Kanji, Hiragana, Katakana oder Han-Zeichen in logische, durchsuchbare Tokens zu zerlegen.
- Strenge Einsprachigkeitsregel: Ihr Katalog und Ihre Suchanfragen müssen in derselben Sprache sein. Die KI übersetzt keine Suchanfragen. Eine spanische Suchanfrage wird also nicht mit einem englischen Katalog abgeglichen. Das Mischen von Sprachen beeinträchtigt die Leistung des Modells erheblich.
- Mehrsprachige Problemumgehung: Wenn ein Katalog Anfragen in verschiedenen Sprachen unterstützen muss, verwenden Sie die Steuerelemente
twowaySynonymsActionoderonewaySynonymsAction, um benutzerdefinierte Suchbegriffe (z. B. spanische Synonyme) manuell der Standardsprache des Katalogs (z. B. Englisch) zuzuordnen.
Weitere Informationen zu Spracheinstellungen finden Sie unter Kataloge und Produkte.