La ricerca e i consigli supportano le seguenti lingue mondiali.
Ricerca per il commercio
Visualizzare le lingue supportate
| Lingue supportate | |
|---|---|
| Albanese | Coreano |
| Arabo | Lettone |
| Armeno | Lituano |
| Assamese | Macedone |
| Azero | Malese |
| Basco | Marathi |
| Bengalese (bangla) | Mongolo |
| Bulgaro | Nepalese |
| Birmano | Norvegese |
| Catalano | Odia |
| Cinese (semplificato) | Persiano |
| Cinese (tradizionale) | Polacco |
| Croato | Portoghese (Europa) |
| Ceco | Portoghese (Brasile) |
| Danese | Punjabi |
| Olandese | Romeno |
| Inglese | Russo |
| Estone | Serbo |
| Finlandese | Serbo (cirillico) |
| Francese (Europa) | Singalese |
| Francese (Canada) | Slovacco |
| Georgiano | Sloveno |
| Tedesco | Spagnolo (Europa) |
| Greco | Spagnolo (America Latina) |
| Gujarati | Swahili |
| Ebraico | Svedese |
| Hindi | Tamil |
| Ungherese | Telugu |
| Islandese | Tailandese |
| Indonesiano | Turco |
| Italiano | Ucraino |
| Giapponese | Urdu (India) |
| Kannada | Urdu (Pakistan) |
| Kazako | Uzbeko |
| Khmer | Vietnamita |
Imposti la lingua quando carichi il catalogo per il progetto Vertex AI Search for Commerce. Il catalogo deve essere in una sola lingua e le query di ricerca devono essere inviate nella stessa lingua. La presenza di più lingue nel catalogo peggiora le prestazioni dell'LLM.
Consigli
La maggior parte delle lingue sono supportate. Il modello rileva automaticamente la lingua del testo.
Visualizzare le lingue supportate
| Nome della lingua | Nome script |
|---|---|
| Afrikaans | Latino |
| Amarico | Etiopico |
| Arabo | Arabo |
| Bulgaro | Cirillico |
| Bulgaro | Latino |
| Bengalese | Bengalese |
| Bosniaco | Latino |
| Catalano | Latino |
| Cebuano | Latino |
| Corso | Latino |
| Ceco | Latino |
| Gallese | Latino |
| Danese | Latino |
| Tedesco | Latino |
| Greco | Greco |
| Greco | Latino |
| Inglese | Latino |
| Esperanto | Latino |
| Spagnolo | Latino |
| Estone | Latino |
| Basco | Latino |
| Persiano | Arabo |
| Finlandese | Latino |
| Filippino | Latino |
| Francese | Latino |
| Frisone occidentale | Latino |
| Irlandese | Latino |
| Gaelico scozzese | Latino |
| Galiziano | Latino |
| Gujarati | Gujarati |
| Hausa | Latino |
| Hawaiano | Latino |
| Hindi | Devanagari |
| Hindi | Latino |
| Hmong | Latino |
| Croato | Latino |
| Creolo haitiano | Latino |
| Ungherese | Latino |
| Armeno | Armeno |
| Indonesiano | Latino |
| Igbo | Latino |
| Islandese | Latino |
| Italiano | Latino |
| Ebraico | Ebraico |
| Giapponese | Giapponese |
| Giapponese | Latino |
| Giavanese | Latino |
| Georgiano | Georgiano |
| Kazako | Cirillico |
| Khmer | Khmer |
| Kannada | Kannada |
| Coreano | Coreano |
| Curdo | Latino |
| Kirgizo | Cirillico |
| Latino | Latino |
| Lussemburghese | Latino |
| Lao | Lao |
| Lituano | Latino |
| Lettone | Latino |
| Malgascio | Latino |
| Maori | Latino |
| Macedone | Cirillico |
| Malayalam | Malayalam |
| Mongolo | Cirillico |
| Marathi | Devanagari |
| Malese | Latino |
| Maltese | Latino |
| Birmano | Myanmar |
| Nepalese | Devanagari |
| Olandese | Latino |
| Norvegese | Latino |
| Nyanja | Latino |
| Punjabi | Gurmukhi |
| Polacco | Latino |
| Pashto | Arabo |
| Portoghese | Latino |
| Romeno | Latino |
| Russo | Cirillico |
| Russo | Inglese |
| Sindhi | Arabo |
| Singalese | Singalese |
| Slovacco | Latino |
| Sloveno | Latino |
| Samoano | Latino |
| Shona | Latino |
| Somalo | Latino |
| Albanese | Latino |
| Serbo | Cirillico |
| Sotho del sud | Latino |
| Sundanese | Latino |
| Svedese | Latino |
| Swahili | Latino |
| Tamil | Tamil |
| Telugu | Telugu |
| Tagico | Cirillico |
| Tailandese | Tailandese |
| Turco | Latino |
| Ucraino | Cirillico |
| Urdu | Arabo |
| Uzbeko | Latino |
| Vietnamita | Latino |
| Xhosa | Latino |
| Yiddish | Ebraico |
| Yoruba | Latino |
| Cinese | Han (inclusi cinese semplificato e tradizionale) |
| Cinese | Latino |
| Zulu | Latino |
Per un elenco di tutte le lingue che possono essere rilevate automaticamente, consulta il file README di GitHub di Compact Language Detector.
Normalizzazione e tokenizzazione della lingua
Il motore di Vertex AI Search for commerce ha un'elaborazione integrata di caratteri cinesi o giapponesi senza spazi e normalizza i segni diacritici europei. In questo modo non è più necessario creare livelli di traduzione di pre-elaborazione proprietari nelle applicazioni di ricerca.
- Normalizzazione dei caratteri non inglesi: il motore di ricerca fornisce il supporto integrato di UTF-8 e normalizza automaticamente i segni diacritici e le dieresi durante l'indicizzazione e l'esecuzione di query (ad esempio, la mappatura di
äaaoaee diéae). In questo modo, gli utenti possono cercare cafe e trovare facilmente café. - Tokenizzazione CJK (Kanji e Katakana): per le lingue cinese, giapponese e coreana (CJK), il motore non si basa sugli spazi per la tokenizzazione. Utilizza segmentatori basati su dizionari e analizzatori morfologici per suddividere le stringhe di caratteri Kanji, Hiragana, Katakana o Han in token logici e ricercabili.
- Regola rigorosa di una sola lingua: il catalogo e le query di ricerca devono essere nella stessa lingua. L'AI non traduce le query di ricerca (in altre parole, una query in spagnolo non corrisponderà a un catalogo in inglese). Il mix di lingue peggiora notevolmente le prestazioni del modello.
- Soluzione alternativa multilingue: se un catalogo deve supportare query in più lingue, utilizza i controlli
twowaySynonymsActionoonewaySynonymsActionper mappare manualmente i termini di query personalizzati (ad esempio i sinonimi in spagnolo) alla lingua predefinita del catalogo (ad esempio l'inglese).
Per saperne di più sulle impostazioni della lingua, consulta la sezione Informazioni su cataloghi e prodotti.