搜索和推荐功能均支持以下世界语言。
Search for Commerce
查看支持的语言
| 支持的语言 | |
|---|---|
| 阿尔巴尼亚语 | 韩语 |
| 阿拉伯语 | 拉脱维亚语 |
| 亚美尼亚语 | 立陶宛语 |
| 阿萨姆语 | 马其顿语 |
| 阿塞拜疆语 | 马来语 |
| 巴斯克语 | 马拉地语 |
| 孟加拉语(孟加拉语) | 蒙古语 |
| 保加利亚语 | 尼泊尔语 |
| 缅甸语 | 挪威语 |
| 加泰罗尼亚语 | 奥里亚语 |
| 简体中文 | 波斯语 |
| 中文(繁体) | 波兰语 |
| 克罗地亚语 | 葡萄牙语(欧洲) |
| 捷克语 | 葡萄牙语(巴西) |
| 丹麦语 | 旁遮普语 |
| 荷兰语 | 罗马尼亚语 |
| 英语 | 俄语 |
| 爱沙尼亚语 | 塞尔维亚语 |
| 芬兰语 | 塞尔维亚语(西里尔字母) |
| 法语(欧洲) | 僧伽罗文 |
| 法语(加拿大) | 斯洛伐克语 |
| 格鲁吉亚语 | 斯洛维尼亚语 |
| 德语 | 西班牙语(欧洲) |
| 希腊语 | 西班牙语(拉丁美洲) |
| 古吉拉特文 | 斯瓦希里语 |
| 希伯来语 | 瑞典语 |
| 印地语 | 泰米尔语 |
| 匈牙利语 | 泰卢固语 |
| 冰岛语 | 泰语 |
| 印度尼西亚语 | 土耳其语 |
| 意大利语 | 乌克兰语 |
| 日语 | 乌尔都语(印度) |
| 卡纳达语 | 乌尔都语(巴基斯坦) |
| 哈萨克语 | 乌兹别克语 |
| 高棉语 | 越南语 |
混合语言设置
您可以在为 AI 商务搜索项目上传目录时设置语言。目录应仅使用一种语言,并且搜索查询应使用相同的语言发送。目录中包含多种语言可能会降低 LLM 性能。
为避免这种情况,并继续优化多种语言的搜索事件,您有以下两种选择:
- 对于任何低流量和不寻常的语言,您可以将这些查询路由到主项目。AI 商务搜索会自动翻译这些查询。
- 如果您有大量其他语言的流量,并且知道这些查询与哪些用户相关联,则可以创建两个项目,每个项目使用一种语言,并相应地路由关联的查询。
建议
支持大多数语言。模型会自动检测文本语言。
查看支持的语言
| 语言名称 | 脚本名称 |
|---|---|
| 南非荷兰语 | 拉丁语 |
| 阿姆哈拉语 | 埃塞俄比亚文 |
| 阿拉伯语 | 阿拉伯语 |
| 保加利亚语 | 西里尔文 |
| 保加利亚语 | 拉丁语 |
| 孟加拉语 | 孟加拉语 |
| 波斯尼亚语 | 拉丁语 |
| 加泰罗尼亚语 | 拉丁语 |
| 宿务语 | 拉丁语 |
| 科西嘉语 | 拉丁语 |
| 捷克语 | 拉丁语 |
| 威尔士语 | 拉丁语 |
| 丹麦语 | 拉丁语 |
| 德语 | 拉丁语 |
| 希腊语 | 希腊语 |
| 希腊语 | 拉丁语 |
| 英语 | 拉丁语 |
| 世界语 | 拉丁语 |
| 西班牙语 | 拉丁语 |
| 爱沙尼亚语 | 拉丁语 |
| 巴斯克语 | 拉丁语 |
| 波斯语 | 阿拉伯语 |
| 芬兰语 | 拉丁语 |
| 菲律宾语 | 拉丁语 |
| 法语 | 拉丁语 |
| 西弗里西亚语 | 拉丁语 |
| 爱尔兰语 | 拉丁语 |
| 苏格兰盖尔语 | 拉丁语 |
| 加利西亚语 | 拉丁语 |
| 古吉拉特文 | 古吉拉特文 |
| 豪萨语 | 拉丁语 |
| 夏威夷语 | 拉丁语 |
| 印地语 | 梵文 |
| 印地语 | 拉丁语 |
| 苗语 | 拉丁语 |
| 克罗地亚语 | 拉丁语 |
| 海地克里奥尔语 | 拉丁语 |
| 匈牙利语 | 拉丁语 |
| 亚美尼亚语 | 亚美尼亚语 |
| 印度尼西亚语 | 拉丁语 |
| 伊博语 | 拉丁语 |
| 冰岛语 | 拉丁语 |
| 意大利语 | 拉丁语 |
| 希伯来语 | 希伯来语 |
| 日语 | 日语 |
| 日语 | 拉丁语 |
| 爪哇语 | 拉丁语 |
| 格鲁吉亚语 | 格鲁吉亚语 |
| 哈萨克语 | 西里尔文 |
| 高棉语 | 高棉语 |
| 卡纳达语 | 卡纳达语 |
| 韩语 | 韩语 |
| 库尔德语 | 拉丁语 |
| 吉尔吉斯语 | 西里尔文 |
| 拉丁语 | 拉丁语 |
| 卢森堡语 | 拉丁语 |
| 老挝语 | 老挝语 |
| 立陶宛语 | 拉丁语 |
| 拉脱维亚语 | 拉丁语 |
| 马尔加什语 | 拉丁语 |
| 毛利语 | 拉丁语 |
| 马其顿语 | 西里尔文 |
| 马拉雅拉姆语 | 马拉雅拉姆语 |
| 蒙古语 | 西里尔文 |
| 马拉地语 | 梵文 |
| 马来语 | 拉丁语 |
| 马耳他语 | 拉丁语 |
| 缅甸语 | 缅甸 |
| 尼泊尔语 | 梵文 |
| 荷兰语 | 拉丁语 |
| 挪威语 | 拉丁语 |
| 尼昂加语 | 拉丁语 |
| 旁遮普语 | 果鲁穆奇文 |
| 波兰语 | 拉丁语 |
| 普什图语 | 阿拉伯语 |
| 葡萄牙语 | 拉丁语 |
| 罗马尼亚语 | 拉丁语 |
| 俄语 | 西里尔文 |
| 俄语 | 英语 |
| 信德语 | 阿拉伯语 |
| 僧伽罗文 | 僧伽罗文 |
| 斯洛伐克语 | 拉丁语 |
| 斯洛维尼亚语 | 拉丁语 |
| 萨摩亚语 | 拉丁语 |
| 修纳语 | 拉丁语 |
| 索马里语 | 拉丁语 |
| 阿尔巴尼亚语 | 拉丁语 |
| 塞尔维亚语 | 西里尔文 |
| 南索托语 | 拉丁语 |
| 巽他语 | 拉丁语 |
| 瑞典语 | 拉丁语 |
| 斯瓦希里语 | 拉丁语 |
| 泰米尔语 | 泰米尔语 |
| 泰卢固语 | 泰卢固语 |
| 塔吉克语 | 西里尔文 |
| 泰语 | 泰语 |
| 土耳其语 | 拉丁语 |
| 乌克兰语 | 西里尔文 |
| 乌尔都语 | 阿拉伯语 |
| 乌兹别克语 | 拉丁语 |
| 越南语 | 拉丁语 |
| 科萨语 | 拉丁语 |
| 意第绪语 | 希伯来语 |
| 约鲁巴语 | 拉丁语 |
| 中文 | 汉字(包括简体和繁体) |
| 中文 | 拉丁语 |
| 祖鲁语 | 拉丁语 |
如需查看可自动检测的所有语言的列表,请参阅紧凑语言检测器 GitHub README。
语言归一化和词法单元化
AI 商业搜索引擎内置了对不含空格的中文或日文字符的处理功能,并可将欧洲变音符号标准化。这样一来,您无需在搜索应用中构建专有的预处理翻译层。
- 非英文字符归一化:搜索引擎内置了对 UTF-8 的支持,并在索引和查询期间自动对变音符号和元音变音进行归一化处理(例如将
ä映射到a或ae,并将é映射到e)。这样一来,用户就可以搜索 cafe,并无缝找到 café。 - CJK 词法单元化(汉字和片假名):对于中文、日语和韩语 (CJK),引擎不依赖空格进行词法单元化。它利用基于字典的分词器和词法分析器将日语汉字、平假名、片假名或汉字字符串分解为可搜索的逻辑令牌。
- 严格的单语言规则:您的目录和搜索查询必须使用同一种语言。西班牙语查询不会与英语目录匹配。混合使用语言可能会降低模型性能。
- 多语言问题解决方法:如果目录必须支持混合语言查询,请使用
twowaySynonymsAction或onewaySynonymsAction控制变量将自定义查询字词(例如西班牙语同义词)手动映射到默认目录语言(例如英语)。
如需详细了解语言设置,请参阅目录和商品简介。