支持的全球语言

搜索和推荐功能均支持以下世界语言。

Search for Commerce

查看支持的语言

支持的语言
阿尔巴尼亚语韩语
阿拉伯语拉脱维亚语
亚美尼亚语立陶宛语
阿萨姆语马其顿语
阿塞拜疆语马来语
巴斯克语马拉地语
孟加拉语(孟加拉语)蒙古语
保加利亚语尼泊尔语
缅甸语挪威语
加泰罗尼亚语奥里亚语
简体中文波斯语
中文(繁体)波兰语
克罗地亚语葡萄牙语(欧洲)
捷克语葡萄牙语(巴西)
丹麦语旁遮普语
荷兰语罗马尼亚语
英语俄语
爱沙尼亚语塞尔维亚语
芬兰语塞尔维亚语(西里尔字母)
法语(欧洲)僧伽罗文
法语(加拿大)斯洛伐克语
格鲁吉亚语斯洛维尼亚语
德语西班牙语(欧洲)
希腊语西班牙语(拉丁美洲)
古吉拉特文斯瓦希里语
希伯来语瑞典语
印地语泰米尔语
匈牙利语泰卢固语
冰岛语泰语
印度尼西亚语土耳其语
意大利语乌克兰语
日语乌尔都语(印度)
卡纳达语乌尔都语(巴基斯坦)
哈萨克语乌兹别克语
高棉语越南语

混合语言设置

您可以在为 AI 商务搜索项目上传目录时设置语言。目录应仅使用一种语言,并且搜索查询应使用相同的语言发送。目录中包含多种语言可能会降低 LLM 性能。

为避免这种情况,并继续优化多种语言的搜索事件,您有以下两种选择:

  • 对于任何低流量和不寻常的语言,您可以将这些查询路由到主项目。AI 商务搜索会自动翻译这些查询。
  • 如果您有大量其他语言的流量,并且知道这些查询与哪些用户相关联,则可以创建两个项目,每个项目使用一种语言,并相应地路由关联的查询。

建议

支持大多数语言。模型会自动检测文本语言。

查看支持的语言

语言名称 脚本名称
南非荷兰语 拉丁语
阿姆哈拉语 埃塞俄比亚文
阿拉伯语 阿拉伯语
保加利亚语 西里尔文
保加利亚语 拉丁语
孟加拉语 孟加拉语
波斯尼亚语 拉丁语
加泰罗尼亚语 拉丁语
宿务语 拉丁语
科西嘉语 拉丁语
捷克语 拉丁语
威尔士语 拉丁语
丹麦语 拉丁语
德语 拉丁语
希腊语 希腊语
希腊语 拉丁语
英语 拉丁语
世界语 拉丁语
西班牙语 拉丁语
爱沙尼亚语 拉丁语
巴斯克语 拉丁语
波斯语 阿拉伯语
芬兰语 拉丁语
菲律宾语 拉丁语
法语 拉丁语
西弗里西亚语 拉丁语
爱尔兰语 拉丁语
苏格兰盖尔语 拉丁语
加利西亚语 拉丁语
古吉拉特文 古吉拉特文
豪萨语 拉丁语
夏威夷语 拉丁语
印地语 梵文
印地语 拉丁语
苗语 拉丁语
克罗地亚语 拉丁语
海地克里奥尔语 拉丁语
匈牙利语 拉丁语
亚美尼亚语 亚美尼亚语
印度尼西亚语 拉丁语
伊博语 拉丁语
冰岛语 拉丁语
意大利语 拉丁语
希伯来语 希伯来语
日语 日语
日语 拉丁语
爪哇语 拉丁语
格鲁吉亚语 格鲁吉亚语
哈萨克语 西里尔文
高棉语 高棉语
卡纳达语 卡纳达语
韩语 韩语
库尔德语 拉丁语
吉尔吉斯语 西里尔文
拉丁语 拉丁语
卢森堡语 拉丁语
老挝语 老挝语
立陶宛语 拉丁语
拉脱维亚语 拉丁语
马尔加什语 拉丁语
毛利语 拉丁语
马其顿语 西里尔文
马拉雅拉姆语 马拉雅拉姆语
蒙古语 西里尔文
马拉地语 梵文
马来语 拉丁语
马耳他语 拉丁语
缅甸语 缅甸
尼泊尔语 梵文
荷兰语 拉丁语
挪威语 拉丁语
尼昂加语 拉丁语
旁遮普语 果鲁穆奇文
波兰语 拉丁语
普什图语 阿拉伯语
葡萄牙语 拉丁语
罗马尼亚语 拉丁语
俄语 西里尔文
俄语 英语
信德语 阿拉伯语
僧伽罗文 僧伽罗文
斯洛伐克语 拉丁语
斯洛维尼亚语 拉丁语
萨摩亚语 拉丁语
修纳语 拉丁语
索马里语 拉丁语
阿尔巴尼亚语 拉丁语
塞尔维亚语 西里尔文
南索托语 拉丁语
巽他语 拉丁语
瑞典语 拉丁语
斯瓦希里语 拉丁语
泰米尔语 泰米尔语
泰卢固语 泰卢固语
塔吉克语 西里尔文
泰语 泰语
土耳其语 拉丁语
乌克兰语 西里尔文
乌尔都语 阿拉伯语
乌兹别克语 拉丁语
越南语 拉丁语
科萨语 拉丁语
意第绪语 希伯来语
约鲁巴语 拉丁语
中文 汉字(包括简体和繁体)
中文 拉丁语
祖鲁语 拉丁语

如需查看可自动检测的所有语言的列表,请参阅紧凑语言检测器 GitHub README

语言归一化和词法单元化

AI 商业搜索引擎内置了对不含空格的中文或日文字符的处理功能,并可将欧洲变音符号标准化。这样一来,您无需在搜索应用中构建专有的预处理翻译层。

  • 非英文字符归一化:搜索引擎内置了对 UTF-8 的支持,并在索引和查询期间自动对变音符号和元音变音进行归一化处理(例如将 ä 映射到 aae,并将 é 映射到 e)。这样一来,用户就可以搜索 cafe,并无缝找到 café
  • CJK 词法单元化(汉字和片假名):对于中文、日语和韩语 (CJK),引擎不依赖空格进行词法单元化。它利用基于字典的分词器和词法分析器将日语汉字、平假名、片假名或汉字字符串分解为可搜索的逻辑令牌。
  • 严格的单语言规则:您的目录和搜索查询必须使用同一种语言。西班牙语查询不会与英语目录匹配。混合使用语言可能会降低模型性能。
  • 多语言问题解决方法:如果目录必须支持混合语言查询,请使用 twowaySynonymsActiononewaySynonymsAction 控制变量将自定义查询字词(例如西班牙语同义词)手动映射到默认目录语言(例如英语)。

如需详细了解语言设置,请参阅目录和商品简介