支援的語言

搜尋和建議功能都支援下列語言。

Search for Commerce

查看支援的語言

支援的語言
阿爾巴尼亞文韓文
阿拉伯文拉脫維亞文
亞美尼亞文立陶宛文
阿薩姆文馬其頓文
亞塞拜然文馬來文
巴斯克文馬拉地文
孟加拉文 (孟加拉)蒙古文
保加利亞文尼泊爾文
緬甸文挪威文
加泰隆尼亞文歐利亞文
簡體中文波斯文
繁體中文 (台灣)波蘭文
克羅埃西亞文葡萄牙文 (歐洲)
捷克文葡萄牙文 (巴西)
丹麥文旁遮普文
荷蘭文羅馬尼亞文
英文俄文
愛沙尼亞文塞爾維亞文
芬蘭文塞爾維亞文 (西里爾字母)
法文 (歐洲)錫蘭文
法文 (加拿大)斯洛伐克文
喬治亞文斯洛維尼亞文
德文西班牙文 (歐洲)
希臘文西班牙文 (拉丁美洲)
古吉拉特文斯瓦希里文
希伯來文瑞典文
北印度文泰米爾文
匈牙利文泰盧固文
冰島文泰文
印尼文土耳其文
義大利文烏克蘭文
日文烏都文 (印度)
卡納達文烏爾都文 (巴基斯坦)
哈薩克文烏茲別克文
高棉文越南文

混合語言設定

上傳 AI Commerce Search 專案的目錄時,您會設定語言。目錄只能使用一種語言,搜尋查詢也必須使用相同語言。目錄中有多種語言可能會降低 LLM 效能。

為避免這種情況,並繼續以多種語言最佳化搜尋事件,您有兩種做法:

  • 對於流量偏低和不常見的語言,您可以將這些查詢路徑導向主要專案。AI Commerce Search 會自動翻譯這些查詢。
  • 如果您的流量有很大一部分來自其他語言,且您知道這些查詢與哪些使用者相關聯,請建立兩個專案,每個專案各使用一種語言,並相應地將相關聯的查詢轉送至專案。

建議

系統支援大部分語言,模型會自動偵測文字語言。

查看支援的語言

語言名稱 指令碼名稱
南非荷蘭文 拉丁文
阿姆哈拉文 衣索比亞文
阿拉伯文 阿拉伯文
保加利亞文 斯拉夫文
保加利亞文 拉丁文
孟加拉文 孟加拉文
波士尼亞文 拉丁文
加泰隆尼亞文 拉丁文
宿霧文 拉丁文
科西嘉文 拉丁文
捷克文 拉丁文
威爾斯文 拉丁文
丹麥文 拉丁文
德文 拉丁文
希臘文 希臘文
希臘文 拉丁文
英文 拉丁文
世界文 拉丁文
西班牙文 拉丁文
愛沙尼亞文 拉丁文
巴斯克文 拉丁文
波斯文 阿拉伯文
芬蘭文 拉丁文
菲律賓文 拉丁文
法文 拉丁文
西弗里西亞文 拉丁文
愛爾蘭文 拉丁文
蘇格蘭蓋爾文 拉丁文
加里西亞文 拉丁文
古吉拉特文 古吉拉特文
豪薩文 拉丁文
夏威夷文 拉丁文
北印度文 梵文
北印度文 拉丁文
苗文 拉丁文
克羅埃西亞文 拉丁文
海地克里奧爾文 拉丁文
匈牙利文 拉丁文
亞美尼亞文 亞美尼亞文
印尼文 拉丁文
伊博文 拉丁文
冰島文 拉丁文
義大利文 拉丁文
希伯來文 希伯來文
日文 日文
日文 拉丁文
爪哇文 拉丁文
喬治亞文 喬治亞文
哈薩克文 斯拉夫文
高棉文 高棉文
卡納達文 卡納達文
韓文 韓文
庫德文 拉丁文
吉爾吉斯文 斯拉夫文
拉丁文 拉丁文
盧森堡文 拉丁文
寮文 寮文
立陶宛文 拉丁文
拉脫維亞文 拉丁文
馬達加斯加文 拉丁文
毛利文 拉丁文
馬其頓文 斯拉夫文
馬拉雅拉姆文 馬拉雅拉姆文
蒙古文 斯拉夫文
馬拉地文 梵文
馬來文 拉丁文
馬耳他文 拉丁文
緬甸文 緬甸
尼泊爾文 梵文
荷蘭文 拉丁文
挪威文 拉丁文
尼揚賈文 拉丁文
旁遮普文 古爾穆基文
波蘭文 拉丁文
普什圖文 阿拉伯文
葡萄牙文 拉丁文
羅馬尼亞文 拉丁文
俄文 斯拉夫文
俄文 英文
信德文 阿拉伯文
錫蘭文 錫蘭文
斯洛伐克文 拉丁文
斯洛維尼亞文 拉丁文
薩摩亞文 拉丁文
修納文 拉丁文
索馬利文 拉丁文
阿爾巴尼亞文 拉丁文
塞爾維亞文 斯拉夫文
塞索托文 拉丁文
巽他文 拉丁文
瑞典文 拉丁文
斯瓦希里文 拉丁文
泰米爾文 泰米爾文
泰盧固文 泰盧固文
塔吉克文 斯拉夫文
泰文 泰文
土耳其文 拉丁文
烏克蘭文 斯拉夫文
烏都文 阿拉伯文
烏茲別克文 拉丁文
越南文 拉丁文
科薩文 拉丁文
意第緒語 希伯來文
約魯巴文 拉丁文
中文 漢字 (包括簡體和繁體)
中文 拉丁文
祖魯文 拉丁文

如要查看可自動偵測的所有語言清單,請參閱 Compact Language Detector GitHub README

語言正規化和符記化

AI Commerce Search 引擎內建處理不含空格的中文字元或日文字元,並會將歐洲變音符號標準化。這樣一來,您就不必在搜尋應用程式中建構專屬的預先處理翻譯層。

  • 非英文字元正規化:搜尋引擎內建 UTF-8 支援功能,會在建立索引和查詢期間自動正規化變音符號和雙點 (例如將 ä 對應至 aae,以及將 é 對應至 e)。這樣一來,使用者搜尋「cafe」時,就能順利找到「café」
  • 中日韓代碼化 (漢字和片假名):對於中文、日文和韓文 (中日韓) 語言,引擎不會依賴空格進行代碼化。這項功能會使用以字典為基礎的區隔器和形態分析器,將漢字、平假名、片假名或漢字字串分解為可搜尋的邏輯符記。
  • 嚴格的單一語言規則:目錄和搜尋查詢必須使用相同語言。西班牙文查詢不會與英文目錄相符。混用語言可能會降低模型效能。
  • 多語解決方法:如果目錄必須支援混合語言查詢,請使用 twowaySynonymsActiononewaySynonymsAction 控制項,手動將自訂查詢字詞 (例如西班牙文同義字) 對應至預設目錄語言 (例如英文)。

如要進一步瞭解語言設定,請參閱「關於目錄和產品」。