La ricerca e i consigli supportano le seguenti lingue mondiali.
Ricerca per il commercio
Visualizzare le lingue supportate
| Lingue supportate | |
|---|---|
| Albanese | Coreano |
| Arabo | Lettone |
| Armeno | Lituano |
| Assamese | Macedone |
| Azero | Malese |
| Basco | Marathi |
| Bengalese (bangla) | Mongolo |
| Bulgaro | Nepalese |
| Birmano | Norvegese |
| Catalano | Odia |
| Cinese (semplificato) | Persiano |
| Cinese (tradizionale) | Polacco |
| Croato | Portoghese (Europa) |
| Ceco | Portoghese (Brasile) |
| Danese | Punjabi |
| Olandese | Romeno |
| Inglese | Russo |
| Estone | Serbo |
| Finlandese | Serbo (cirillico) |
| Francese (Europa) | Singalese |
| Francese (Canada) | Slovacco |
| Georgiano | Sloveno |
| Tedesco | Spagnolo (Europa) |
| Greco | Spagnolo (America Latina) |
| Gujarati | Swahili |
| Ebraico | Svedese |
| Hindi | Tamil |
| Ungherese | Telugu |
| Islandese | Tailandese |
| Indonesiano | Turco |
| Italiano | Ucraino |
| Giapponese | Urdu (India) |
| Kannada | Urdu (Pakistan) |
| Kazako | Uzbeko |
| Khmer | Vietnamita |
Impostazioni di lingua miste
Imposti la lingua quando carichi il catalogo per il progetto Agent Platform Search per il commercio. Il catalogo deve essere in una sola lingua e le query di ricerca devono essere inviate nella stessa lingua. La presenza di più lingue nel catalogo può peggiorare le prestazioni del modello LLM.
Per evitare questo problema e continuare a ottimizzare gli eventi di ricerca in più lingue, hai due opzioni:
- Per le lingue insolite e con poco traffico, puoi indirizzare le query al progetto principale. La ricerca Agent Platform per il commercio traduce automaticamente queste query.
- Se hai molto traffico in un'altra lingua e sai a quali utenti sono associate queste query, crea due progetti, uno per ogni lingua, e fai in modo che le query associate vengano indirizzate di conseguenza.
Consigli
La maggior parte delle lingue sono supportate. Il modello rileva automaticamente la lingua del testo.
Visualizzare le lingue supportate
| Nome della lingua | Nome script |
|---|---|
| Afrikaans | Latino |
| Amarico | Etiopico |
| Arabo | Arabo |
| Bulgaro | Cirillico |
| Bulgaro | Latino |
| Bengalese | Bengalese |
| Bosniaco | Latino |
| Catalano | Latino |
| Cebuano | Latino |
| Corso | Latino |
| Ceco | Latino |
| Gallese | Latino |
| Danese | Latino |
| Tedesco | Latino |
| Greco | Greco |
| Greco | Latino |
| Inglese | Latino |
| Esperanto | Latino |
| Spagnolo | Latino |
| Estone | Latino |
| Basco | Latino |
| Persiano | Arabo |
| Finlandese | Latino |
| Filippino | Latino |
| Francese | Latino |
| Frisone occidentale | Latino |
| Irlandese | Latino |
| Gaelico scozzese | Latino |
| Galiziano | Latino |
| Gujarati | Gujarati |
| Hausa | Latino |
| Hawaiano | Latino |
| Hindi | Devanagari |
| Hindi | Latino |
| Hmong | Latino |
| Croato | Latino |
| Creolo haitiano | Latino |
| Ungherese | Latino |
| Armeno | Armeno |
| Indonesiano | Latino |
| Igbo | Latino |
| Islandese | Latino |
| Italiano | Latino |
| Ebraico | Ebraico |
| Giapponese | Giapponese |
| Giapponese | Latino |
| Giavanese | Latino |
| Georgiano | Georgiano |
| Kazako | Cirillico |
| Khmer | Khmer |
| Kannada | Kannada |
| Coreano | Coreano |
| Curdo | Latino |
| Kirgizo | Cirillico |
| Latino | Latino |
| Lussemburghese | Latino |
| Lao | Lao |
| Lituano | Latino |
| Lettone | Latino |
| Malgascio | Latino |
| Maori | Latino |
| Macedone | Cirillico |
| Malayalam | Malayalam |
| Mongolo | Cirillico |
| Marathi | Devanagari |
| Malese | Latino |
| Maltese | Latino |
| Birmano | Myanmar |
| Nepalese | Devanagari |
| Olandese | Latino |
| Norvegese | Latino |
| Nyanja | Latino |
| Punjabi | Gurmukhi |
| Polacco | Latino |
| Pashto | Arabo |
| Portoghese | Latino |
| Romeno | Latino |
| Russo | Cirillico |
| Russo | Inglese |
| Sindhi | Arabo |
| Singalese | Singalese |
| Slovacco | Latino |
| Sloveno | Latino |
| Samoano | Latino |
| Shona | Latino |
| Somalo | Latino |
| Albanese | Latino |
| Serbo | Cirillico |
| Sotho del sud | Latino |
| Sundanese | Latino |
| Svedese | Latino |
| Swahili | Latino |
| Tamil | Tamil |
| Telugu | Telugu |
| Tagico | Cirillico |
| Tailandese | Tailandese |
| Turco | Latino |
| Ucraino | Cirillico |
| Urdu | Arabo |
| Uzbeko | Latino |
| Vietnamita | Latino |
| Xhosa | Latino |
| Yiddish | Ebraico |
| Yoruba | Latino |
| Cinese | Han (inclusi semplificato e tradizionale) |
| Cinese | Latino |
| Zulu | Latino |
Per un elenco di tutte le lingue che possono essere rilevate automaticamente, consulta il file README di GitHub di Compact Language Detector.
Normalizzazione e tokenizzazione della lingua
La ricerca della piattaforma di agenti per il motore di commercio ha un'elaborazione integrata di caratteri cinesi o giapponesi senza spazi e normalizza i segni diacritici europei. In questo modo non è più necessario creare livelli di traduzione di pre-elaborazione proprietari nelle applicazioni di ricerca.
- Normalizzazione dei caratteri non inglesi: il motore di ricerca fornisce il supporto integrato di UTF-8 e normalizza automaticamente i segni diacritici e le dieresi durante l'indicizzazione e l'esecuzione di query (ad esempio, la mappatura di
äaaoaee diéae). In questo modo, gli utenti possono cercare cafe e trovare facilmente café. - Tokenizzazione CJK (Kanji e Katakana): per le lingue cinese, giapponese e coreana (CJK), il motore non si basa sugli spazi per la tokenizzazione. Utilizza segmentatori basati su dizionario e analizzatori morfologici per suddividere le stringhe di caratteri kanji, hiragana, katakana o han in token logici e ricercabili.
- Regola rigorosa di una sola lingua: il catalogo e le query di ricerca devono essere nella stessa lingua. Una query in spagnolo non corrisponderà a un catalogo in inglese. La combinazione di lingue può ridurre le prestazioni del modello.
- Soluzione alternativa multilingue: se un catalogo deve supportare query in più lingue, utilizza i controlli
twowaySynonymsActionoonewaySynonymsActionper mappare manualmente i termini di query personalizzati (ad esempio i sinonimi in spagnolo) alla lingua predefinita del catalogo (ad esempio l'inglese).
Per saperne di più sulle impostazioni della lingua, consulta la sezione Informazioni su cataloghi e prodotti.