Lingue mondiali supportate

La ricerca e i consigli supportano le seguenti lingue mondiali.

Ricerca per il commercio

Visualizzare le lingue supportate

Lingue supportate
AlbaneseCoreano
AraboLettone
ArmenoLituano
AssameseMacedone
AzeroMalese
BascoMarathi
Bengalese (bangla)Mongolo
BulgaroNepalese
BirmanoNorvegese
CatalanoOdia
Cinese (semplificato)Persiano
Cinese (tradizionale)Polacco
CroatoPortoghese (Europa)
CecoPortoghese (Brasile)
DanesePunjabi
OlandeseRomeno
IngleseRusso
EstoneSerbo
FinlandeseSerbo (cirillico)
Francese (Europa)Singalese
Francese (Canada)Slovacco
GeorgianoSloveno
TedescoSpagnolo (Europa)
GrecoSpagnolo (America Latina)
GujaratiSwahili
EbraicoSvedese
HindiTamil
UnghereseTelugu
IslandeseTailandese
IndonesianoTurco
ItalianoUcraino
GiapponeseUrdu (India)
KannadaUrdu (Pakistan)
KazakoUzbeko
KhmerVietnamita

Imposti la lingua quando carichi il catalogo per il progetto Vertex AI Search for Commerce. Il catalogo deve essere in una sola lingua e le query di ricerca devono essere inviate nella stessa lingua. La presenza di più lingue nel catalogo peggiora le prestazioni dell'LLM.

Consigli

La maggior parte delle lingue sono supportate. Il modello rileva automaticamente la lingua del testo.

Visualizzare le lingue supportate

Nome della lingua Nome script
Afrikaans Latino
Amarico Etiopico
Arabo Arabo
Bulgaro Cirillico
Bulgaro Latino
Bengalese Bengalese
Bosniaco Latino
Catalano Latino
Cebuano Latino
Corso Latino
Ceco Latino
Gallese Latino
Danese Latino
Tedesco Latino
Greco Greco
Greco Latino
Inglese Latino
Esperanto Latino
Spagnolo Latino
Estone Latino
Basco Latino
Persiano Arabo
Finlandese Latino
Filippino Latino
Francese Latino
Frisone occidentale Latino
Irlandese Latino
Gaelico scozzese Latino
Galiziano Latino
Gujarati Gujarati
Hausa Latino
Hawaiano Latino
Hindi Devanagari
Hindi Latino
Hmong Latino
Croato Latino
Creolo haitiano Latino
Ungherese Latino
Armeno Armeno
Indonesiano Latino
Igbo Latino
Islandese Latino
Italiano Latino
Ebraico Ebraico
Giapponese Giapponese
Giapponese Latino
Giavanese Latino
Georgiano Georgiano
Kazako Cirillico
Khmer Khmer
Kannada Kannada
Coreano Coreano
Curdo Latino
Kirgizo Cirillico
Latino Latino
Lussemburghese Latino
Lao Lao
Lituano Latino
Lettone Latino
Malgascio Latino
Maori Latino
Macedone Cirillico
Malayalam Malayalam
Mongolo Cirillico
Marathi Devanagari
Malese Latino
Maltese Latino
Birmano Myanmar
Nepalese Devanagari
Olandese Latino
Norvegese Latino
Nyanja Latino
Punjabi Gurmukhi
Polacco Latino
Pashto Arabo
Portoghese Latino
Romeno Latino
Russo Cirillico
Russo Inglese
Sindhi Arabo
Singalese Singalese
Slovacco Latino
Sloveno Latino
Samoano Latino
Shona Latino
Somalo Latino
Albanese Latino
Serbo Cirillico
Sotho del sud Latino
Sundanese Latino
Svedese Latino
Swahili Latino
Tamil Tamil
Telugu Telugu
Tagico Cirillico
Tailandese Tailandese
Turco Latino
Ucraino Cirillico
Urdu Arabo
Uzbeko Latino
Vietnamita Latino
Xhosa Latino
Yiddish Ebraico
Yoruba Latino
Cinese Han (inclusi cinese semplificato e tradizionale)
Cinese Latino
Zulu Latino

Per un elenco di tutte le lingue che possono essere rilevate automaticamente, consulta il file README di GitHub di Compact Language Detector.

Normalizzazione e tokenizzazione della lingua

Il motore di Vertex AI Search for commerce ha un'elaborazione integrata di caratteri cinesi o giapponesi senza spazi e normalizza i segni diacritici europei. In questo modo non è più necessario creare livelli di traduzione di pre-elaborazione proprietari nelle applicazioni di ricerca.

  • Normalizzazione dei caratteri non inglesi: il motore di ricerca fornisce il supporto integrato di UTF-8 e normalizza automaticamente i segni diacritici e le dieresi durante l'indicizzazione e l'esecuzione di query (ad esempio, la mappatura di ä a a o ae e di é a e). In questo modo, gli utenti possono cercare cafe e trovare facilmente café.
  • Tokenizzazione CJK (Kanji e Katakana): per le lingue cinese, giapponese e coreana (CJK), il motore non si basa sugli spazi per la tokenizzazione. Utilizza segmentatori basati su dizionari e analizzatori morfologici per suddividere le stringhe di caratteri Kanji, Hiragana, Katakana o Han in token logici e ricercabili.
  • Regola rigorosa di una sola lingua: il catalogo e le query di ricerca devono essere nella stessa lingua. L'AI non traduce le query di ricerca (in altre parole, una query in spagnolo non corrisponderà a un catalogo in inglese). Il mix di lingue peggiora notevolmente le prestazioni del modello.
  • Soluzione alternativa multilingue: se un catalogo deve supportare query in più lingue, utilizza i controlli twowaySynonymsAction o onewaySynonymsAction per mappare manualmente i termini di query personalizzati (ad esempio i sinonimi in spagnolo) alla lingua predefinita del catalogo (ad esempio l'inglese).

Per saperne di più sulle impostazioni della lingua, consulta la sezione Informazioni su cataloghi e prodotti.