Lingue mondiali supportate

La ricerca e i consigli supportano le seguenti lingue mondiali.

Ricerca per il commercio

Visualizzare le lingue supportate

Lingue supportate
AlbaneseCoreano
AraboLettone
ArmenoLituano
AssameseMacedone
AzeroMalese
BascoMarathi
Bengalese (bangla)Mongolo
BulgaroNepalese
BirmanoNorvegese
CatalanoOdia
Cinese (semplificato)Persiano
Cinese (tradizionale)Polacco
CroatoPortoghese (Europa)
CecoPortoghese (Brasile)
DanesePunjabi
OlandeseRomeno
IngleseRusso
EstoneSerbo
FinlandeseSerbo (cirillico)
Francese (Europa)Singalese
Francese (Canada)Slovacco
GeorgianoSloveno
TedescoSpagnolo (Europa)
GrecoSpagnolo (America Latina)
GujaratiSwahili
EbraicoSvedese
HindiTamil
UnghereseTelugu
IslandeseTailandese
IndonesianoTurco
ItalianoUcraino
GiapponeseUrdu (India)
KannadaUrdu (Pakistan)
KazakoUzbeko
KhmerVietnamita

Impostazioni di lingua miste

Imposti la lingua quando carichi il catalogo per il progetto Agent Platform Search per il commercio. Il catalogo deve essere in una sola lingua e le query di ricerca devono essere inviate nella stessa lingua. La presenza di più lingue nel catalogo può peggiorare le prestazioni del modello LLM.

Per evitare questo problema e continuare a ottimizzare gli eventi di ricerca in più lingue, hai due opzioni:

  • Per le lingue insolite e con poco traffico, puoi indirizzare le query al progetto principale. La ricerca Agent Platform per il commercio traduce automaticamente queste query.
  • Se hai molto traffico in un'altra lingua e sai a quali utenti sono associate queste query, crea due progetti, uno per ogni lingua, e fai in modo che le query associate vengano indirizzate di conseguenza.

Consigli

La maggior parte delle lingue sono supportate. Il modello rileva automaticamente la lingua del testo.

Visualizzare le lingue supportate

Nome della lingua Nome script
Afrikaans Latino
Amarico Etiopico
Arabo Arabo
Bulgaro Cirillico
Bulgaro Latino
Bengalese Bengalese
Bosniaco Latino
Catalano Latino
Cebuano Latino
Corso Latino
Ceco Latino
Gallese Latino
Danese Latino
Tedesco Latino
Greco Greco
Greco Latino
Inglese Latino
Esperanto Latino
Spagnolo Latino
Estone Latino
Basco Latino
Persiano Arabo
Finlandese Latino
Filippino Latino
Francese Latino
Frisone occidentale Latino
Irlandese Latino
Gaelico scozzese Latino
Galiziano Latino
Gujarati Gujarati
Hausa Latino
Hawaiano Latino
Hindi Devanagari
Hindi Latino
Hmong Latino
Croato Latino
Creolo haitiano Latino
Ungherese Latino
Armeno Armeno
Indonesiano Latino
Igbo Latino
Islandese Latino
Italiano Latino
Ebraico Ebraico
Giapponese Giapponese
Giapponese Latino
Giavanese Latino
Georgiano Georgiano
Kazako Cirillico
Khmer Khmer
Kannada Kannada
Coreano Coreano
Curdo Latino
Kirgizo Cirillico
Latino Latino
Lussemburghese Latino
Lao Lao
Lituano Latino
Lettone Latino
Malgascio Latino
Maori Latino
Macedone Cirillico
Malayalam Malayalam
Mongolo Cirillico
Marathi Devanagari
Malese Latino
Maltese Latino
Birmano Myanmar
Nepalese Devanagari
Olandese Latino
Norvegese Latino
Nyanja Latino
Punjabi Gurmukhi
Polacco Latino
Pashto Arabo
Portoghese Latino
Romeno Latino
Russo Cirillico
Russo Inglese
Sindhi Arabo
Singalese Singalese
Slovacco Latino
Sloveno Latino
Samoano Latino
Shona Latino
Somalo Latino
Albanese Latino
Serbo Cirillico
Sotho del sud Latino
Sundanese Latino
Svedese Latino
Swahili Latino
Tamil Tamil
Telugu Telugu
Tagico Cirillico
Tailandese Tailandese
Turco Latino
Ucraino Cirillico
Urdu Arabo
Uzbeko Latino
Vietnamita Latino
Xhosa Latino
Yiddish Ebraico
Yoruba Latino
Cinese Han (inclusi semplificato e tradizionale)
Cinese Latino
Zulu Latino

Per un elenco di tutte le lingue che possono essere rilevate automaticamente, consulta il file README di GitHub di Compact Language Detector.

Normalizzazione e tokenizzazione della lingua

La ricerca della piattaforma di agenti per il motore di commercio ha un'elaborazione integrata di caratteri cinesi o giapponesi senza spazi e normalizza i segni diacritici europei. In questo modo non è più necessario creare livelli di traduzione di pre-elaborazione proprietari nelle applicazioni di ricerca.

  • Normalizzazione dei caratteri non inglesi: il motore di ricerca fornisce il supporto integrato di UTF-8 e normalizza automaticamente i segni diacritici e le dieresi durante l'indicizzazione e l'esecuzione di query (ad esempio, la mappatura di ä a a o ae e di é a e). In questo modo, gli utenti possono cercare cafe e trovare facilmente café.
  • Tokenizzazione CJK (Kanji e Katakana): per le lingue cinese, giapponese e coreana (CJK), il motore non si basa sugli spazi per la tokenizzazione. Utilizza segmentatori basati su dizionario e analizzatori morfologici per suddividere le stringhe di caratteri kanji, hiragana, katakana o han in token logici e ricercabili.
  • Regola rigorosa di una sola lingua: il catalogo e le query di ricerca devono essere nella stessa lingua. Una query in spagnolo non corrisponderà a un catalogo in inglese. La combinazione di lingue può ridurre le prestazioni del modello.
  • Soluzione alternativa multilingue: se un catalogo deve supportare query in più lingue, utilizza i controlli twowaySynonymsAction o onewaySynonymsAction per mappare manualmente i termini di query personalizzati (ad esempio i sinonimi in spagnolo) alla lingua predefinita del catalogo (ad esempio l'inglese).

Per saperne di più sulle impostazioni della lingua, consulta la sezione Informazioni su cataloghi e prodotti.