Cloud Vision API 的文本识别功能可以检测多种语言,还可以检测单张图片中的多种语言。
您无需为该服务提供语言提示,不过,如果该服务难以检测您的图片中所用的语言,则可以提供语言提示。
随着手写 OCR 正式版 (GA) 的发布,使用 DOCUMENT_TEXT_DETECTION 时包含手写内容的图片不再需要手写 languageHints 标志。
可选语言提示在请求的 ImageContext 中指定,作为 TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 请求的一系列 languageHints。
每个语言代码参数通常都包含一个 BCP-47 标识符。此参数可以采用“language-region”的格式,其中“language”是指主要语言,“region”(可选)是指特定方言的地区(通常是国家/地区标识符)。例如,中文可以表示为中华人民共和国的简体中文 (zh-Hans) 或台湾地区的繁体中文 (zh-Hant)。
文本识别功能支持三种级别的语言:
- 受支持语言,我们会优先考虑这些语言,并定期进行性能评估。
- 实验性语言,这些语言正处于开发阶段,但不会定期评估。
- 映射语言,这些语言可通过映射到其他语言代码或常规字符识别器而获得支持。例如,“
en-GB”受支持,但出于识别文本的目的,系统不会将其与“en”区分对待。我们会尽力在“实体”语言区域字段中返回正确的映射语言代码,但是与完全受支持的语言或用实验方法支持的语言相比,映射语言更有可能被误识别为相似的语言。
下面显示了 TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 支持的语言列表(包含关联的 languageHint 代码)。
如果语言提示留为空白,我们将尝试自动检测最合适的语言。TEXT_DETECTION 端点将仅会自动检测部分受支持的语言,而 DOCUMENT_TEXT_DETECTION 端点将自动检测全部受支持的语言。
支持的语言
以下语言会得到优先考虑并会定期进行评估。
如需按功能过滤,请从下拉菜单中输入或直接选择所需的语言:
| 语言 | 语言(中文名称) | languageHints 代码 |
脚本 | 备注 | |
|---|---|---|---|---|---|
| Afrikaans | 南非荷兰语 | af |
Latn |
||
| shqip | 阿尔巴尼亚语 | sq |
Latn |
||
| العربية | 阿拉伯语 | ar |
Arab |
现代标准 | |
| Հայ | 亚美尼亚语 | hy |
Armn |
||
| беларуская | 白俄罗斯语 | be |
Cyrl |
||
| বাংলা | 孟加拉语 | bn |
Beng |
||
| български | 保加利亚语 | bg |
Cyrl |
||
| Català | 加泰罗尼亚语 | ca |
Latn |
||
| 普通话 | 中文 | zh |
Hans/Hant |
||
| Hrvatski | 克罗地亚语 | hr |
Latn |
||
| Čeština | 捷克语 | cs |
Latn |
||
| Dansk | 丹麦语 | da |
Latn |
||
| Nederlands | 荷兰语 | nl |
Latn |
||
| English | 英语 | en |
Latn |
美国 | |
| Eesti keel | 爱沙尼亚语 | et |
Latn |
||
| Filipino | 菲律宾语 | fil |
Latn |
||
| Suomi | 芬兰语 | fi |
Latn |
||
| Français | 法语 | fr |
Latn |
欧洲 | |
| Deutsch | 德语 | de |
Latn |
||
| Ελληνικά | 希腊语 | el |
Grek |
||
| ગુજરાતી | 古吉拉特语 | gu |
Gujr |
||
| עברית | 希伯来语 | iw |
Hebr |
||
| हिन्दी | 印地语 | hi |
Deva |
||
| Magyar | 匈牙利语 | hu |
Latn |
||
| Íslenska | 冰岛语 | is |
Latn |
||
| Bahasa Indonesia | 印度尼西亚语 | id |
Latn |
||
| Italiano | 意大利语 | it |
Latn |
||
| 日本語 | 日语 | ja |
Jpan |
||
| ಕನ್ನಡ | 卡纳达语 | kn |
Knda |
||
| ភាសាខ្មែរ | 高棉语 | km |
Khmr |
||
| 한국어 | 韩语 | ko |
Kore |
||
| ລາວ | 老挝语 | lo |
Laoo |
||
| Latviešu | 拉脱维亚语 | lv |
Latn |
||
| Lietuvių | 立陶宛语 | lt |
Latn |
||
| Македонски | 马其顿语 | mk |
Cyrl |
||
| Bahasa Melayu | 马来语 | ms |
Latn |
||
| മലയാളം | 马拉雅拉姆语 | ml |
Mlym |
||
| मराठी | 马拉地语 | mr |
Deva |
||
| नेपाली | 尼泊尔语 | ne |
Deva |
||
| Norsk | 挪威语 | no |
Latn |
博克马尔语 | |
| فارسی | 波斯语 | fa |
Arab |
||
| Polski | 波兰语 | pl |
Latn |
||
| Português | 葡萄牙语 | pt |
Latn |
巴西 | |
| ਪੰਜਾਬੀ | 旁遮普语 | pa |
Guru |
果鲁穆奇文 | |
| Română | 罗马尼亚语 | ro |
Latn |
||
| Русский | 俄语 | ru |
Cyrl |
||
| Русский (старая орфография) | 俄语 | ru-PETR1708 |
Cyrl |
古正字法 | |
| Српски | 塞尔维亚语 | sr |
Cyrl |
||
| Српски (латиница) | 塞尔维亚语 | sr-Latn |
Latn |
||
| Slovenčina | 斯洛伐克语 | sk |
Latn |
||
| Slovenščina | 斯洛文尼亚语 | sl |
Latn |
||
| Español | 西班牙语 | es |
Latn |
欧洲 | |
| Svenska | 瑞典语 | sv |
Latn |
||
| Tagalog | 塔加路语 | tl |
Latn |
||
| தமிழ் | 泰米尔语 | ta |
Taml |
||
| తెలుగు | 泰卢固语 | te |
Telu |
||
| ไทย | 泰语 | th |
Thai |
||
| Türkçe | 土耳其语 | tr |
Latn |
||
| Українська | 乌克兰语 | uk |
Cyrl |
||
| Tiếng Việt | 越南语 | vi |
Latn |
||
| Yiddish | 意第绪语 | yi |
Hebr |
实验性语言
以下语言正处于开发阶段,但不会定期评估。
| 语言 | 语言(中文名称) | languageHints 代码 |
脚本 | 备注 | |
|---|---|---|---|---|---|
| አማርኛ | 阿姆哈拉语 | am |
Ethi |
||
| Αρχαία ελληνικά | 古希腊语 | grc |
Grek |
||
| অসমীয়া | 阿萨姆语 | as |
Beng |
||
| Azərbaycan | 阿塞拜疆语 | az |
Latn |
||
| Azərbaycan (qədim yazı) | 阿塞拜疆语 | az-Cyrl |
Cyrl |
古正字法 | |
| Euskara | 巴斯克语 | eu |
Latn |
||
| Bosanski | 波斯尼亚语 | bs |
Latn |
||
| မြန်မာ | 缅甸语 | my |
Mymr |
||
| Cebuano | 宿务语 | ceb |
Latn |
||
| ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | 切罗基文 | chr |
Cher |
||
| dhivehi, dhivehi-bas | 迪维希语 | dv |
Thaa |
||
| རྫོང་ཁ | Dzonkha | dz |
Tibt |
||
| Esperanto | 世界语 | eo |
Latn |
||
| Galego | 加利西亚语 | gl |
Latn |
||
| ქართული | 格鲁吉亚语 | ka |
Geor |
||
| Kreyòl Ayisyen | 海地克里奥尔语 | ht |
Latn |
||
| Gaeilge | 爱尔兰语 | ga |
Latn |
||
| Jawa | 爪哇语 | jv |
Latn |
||
| Қазақ | 哈萨克语 | kk |
Cyrl |
||
| Kirghiz | 吉尔吉斯语 | ky |
Cyrl |
||
| Latine | 拉丁语 | la |
Latn |
||
| Malti | 马耳他语 | mt |
Latn |
||
| Монгол | 蒙古语 | mn |
Cyrl |
||
| ଓଡ଼ିଆ | 奥里亚语 | or |
Orya |
||
| پښتو | 普什图语 | ps |
Arab |
||
| संस्कृतम् | 梵语 | sa |
Deva |
||
| සිංහල | 僧伽罗文 | si |
Sinh |
||
| Swahili | 斯瓦希里语 | sw |
Latn |
||
| leššānā Suryāyā | 叙利亚文 | syr |
Syriac |
||
| བོད་སྐད་ | 藏语 | bo |
Tibt |
||
| ትግርኛ | Tigirinya | ti |
Ethi |
||
| اردو | 乌尔都语 | ur |
Arab |
||
| oʻzbekcha | 乌兹别克语 | uz |
Latn |
拉丁语 | |
| oʻzbekcha | 乌兹别克语 | uz-Cyrl |
Cyrl |
古正字法 | |
| Cymraeg | 威尔士语 | cy |
Latn |
||
| IsiZulu | 祖鲁语 | zu |
Latn |
映射语言
以下语言会映射到其他语言代码或映射到常规字符识别器。
| 语言 | 语言(中文名称) | languageHints 代码 |
脚本 | 备注 | |
|---|---|---|---|---|---|
| بهسا اچيه | 亚齐语 | ace |
Latn |
拉丁语模型 | |
| Lwo | 阿乔利语 | ach |
Latn |
拉丁语模型 | |
| Dangme | Adangme | ada |
Latn |
拉丁语模型 | |
| Akan | Akan | ak |
Latn |
拉丁语模型 | |
| Anicinâbemowin | Algonquinian | alg |
Latn |
拉丁语模型 | |
| Mapudungu | 阿洛柯语/马普切语 | arn |
Latn |
拉丁语模型 | |
| Asturianu | 阿斯图里亚斯语 | ast |
Latn |
拉丁语模型 | |
| Dene | Athabaskan | ath |
Latn |
拉丁语模型 | |
| Aymar aru | 艾马拉语 | ay |
Latn |
拉丁语模型 | |
| Bhāṣa Bali | 巴厘文 | ban |
Latn |
拉丁语模型 | |
| Bamanankan | 班巴拉语 | bm |
Latn |
拉丁语模型 | |
| Narrow Bantu | Bantu | bnt |
Latn |
拉丁语模型 | |
| башҡорт теле | 巴什基尔语 | ba |
Cyrl |
西里尔语模型 | |
| Toba–Batak | 巴塔克文 | btk |
Latn |
拉丁语模型 | |
| Chibemba | Bemba | bem |
Latn |
拉丁语模型 | |
| Bikol Naga | 比考尔语 | bik |
Latn |
拉丁语模型 | |
| Bichelamar | 比斯拉马语 | bi |
Latn |
拉丁语模型 | |
| Brezhoneg | 布列塔尼语 | br |
Latn |
拉丁语模型 | |
| нохчийн мотт / noxçiyn mott | 车臣语 | ce |
Cyrl |
西里尔语模型 | |
| 汉语 | 中文(普通话,简体) | zh-Hans |
Hans |
中文模型 | |
| 漢語 | 中文(普通话,繁体) | zh-Hant |
Hant |
中文模型 | |
| 普通話 | 中文(普通话,香港) | zh-Hant-HK |
Hant |
中文模型 | |
| Chahta' | Choctaw | cho |
Latn |
拉丁语模型 | |
| Чӑвашла | 楚瓦什语 | cv |
Cyrl |
西里尔语模型 | |
| Cree–Montagnais–Naskapi | 克里语 | cr |
Latn |
拉丁语模型 | |
| Mvskoke | 克里克语 | mus |
Latn |
拉丁语模型 | |
| qırımtatar tili, къырымтатар тили | 克里米亚鞑靼语 | crh |
Latn |
西里尔语模型 | |
| Dakhótiyapi, Dakȟótiyapi | Dakota | dak |
Latn |
拉丁语模型 | |
| Douala | Duala | dua |
Latn |
拉丁语模型 | |
| Ikɔ Efik | 埃菲克语 | efi |
Latn |
拉丁语模型 | |
| English (British) | 英语(英国) | en-GB |
Latn |
拉丁语模型 | |
| Èʋegbe | 埃维语 | ee |
Latn |
拉丁语模型 | |
| føroyskt mál | 法罗语 | fo |
Latn |
拉丁语模型 | |
| Na Vosa Vakaviti | 斐济语 | fj |
Latn |
拉丁语模型 | |
| fɔ̀ngbè | Fon | fon |
Latn |
拉丁语模型 | |
| Français canadien | 法语(加拿大) | fr-CA |
Latn |
拉丁语模型 | |
| Fulani, Fulah, Peul | 富拉语 | ff |
Latn |
拉丁语模型 | |
| Gã | 加语 | gaa |
Latn |
拉丁语模型 | |
| Luganda | Ganda | lg |
Latn |
拉丁语模型 | |
| Basa Gayo | Gayo | gay |
Latn |
拉丁语模型 | |
| Kiribati | 吉尔伯特语 | gil |
Latn |
拉丁语模型 | |
| Gothic | 哥特文 | got |
Latn |
拉丁语模型 | |
| Guaraní | 瓜拉尼人 | gn |
Latn |
拉丁语模型 | |
| Harshen/Halshen Hausa هَرْشَن هَوْسَ | 豪萨语 | ha |
Latn |
拉丁语模型 | |
| ʻŌlelo Hawaiʻi | 夏威夷语 | haw |
Latn |
拉丁语模型 | |
| Otjiherero | Herero | hz |
Latn |
拉丁语模型 | |
| Ilonggo | 希利盖农语 | hil |
Latn |
拉丁语模型 | |
| Jaku Iban | Iban | iba |
Latn |
拉丁语模型 | |
| Asụsụ Igbo | Igbo | ig |
Latn |
拉丁语模型 | |
| Ilokano | 伊洛果语 | ilo |
Latn |
拉丁语模型 | |
| Taqbaylit | 卡拜尔语 | kab |
Latn |
拉丁语模型 | |
| Jingpho | 克钦语 | kac |
Latn |
拉丁语模型 | |
| Kalaallisut | 格陵兰语 | kl |
Latn |
拉丁语模型 | |
| Kikamba | 卡姆巴语 | kam |
Latn |
拉丁语模型 | |
| Kanuri | Kanuri | kr |
Latn |
拉丁语模型 | |
| Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | 卡拉卡尔帕克语 | kaa |
Cyrl/Latn |
西里尔语模型 | |
| Ka Ktien Khasi | 卡西语 | kha |
Latn |
拉丁语模型 | |
| Gĩkũyũ | 吉库尤语 | ki |
Latn |
拉丁语模型 | |
| Kinyarwanda | 卢旺达语 | rw |
Latn |
拉丁语模型 | |
| коми кыв | 科米语 | kv |
Cyrl |
西里尔语模型 | |
| Kikongo | 刚果语 | kg |
Latn |
拉丁语模型 | |
| Kosraean | Kosraean | kos |
Latn |
拉丁语模型 | |
| Oshikwanyama | 宽尼亚玛语 | kj |
Latn |
拉丁语模型 | |
| Ngala | 林加拉语 | ln |
Latn |
拉丁语模型 | |
| Plattdütsch, Plattdeutsch, Nedersaksisch | 低地德语 | nds |
Latn |
拉丁语模型 | |
| siLozi | 罗兹语 | loz |
Latn |
拉丁语模型 | |
| Kiluba | 卢巴加丹加语 | lu |
Latn |
拉丁语模型 | |
| Dholuo | 卢奥语 | luo |
Latn |
拉丁语模型 | |
| Madhura, Basa Mathura, بَهاسَ مَدورا | 马都拉语 | mad |
Latn |
拉丁语模型 | |
| Malagasy | 马尔加什语 | mg |
Latn |
拉丁语模型 | |
| Mandinka, لغة مندنكا | 曼丁果语 | man |
Latn |
拉丁语模型 | |
| Gaelg, Gailck | 马恩岛语 | gv |
Latn |
拉丁语模型 | |
| Te reo Māori | 毛利语 | mi |
Latn |
拉丁语模型 | |
| Ebon | 马绍尔语 | mh |
Latn |
拉丁语模型 | |
| Mɛnde yia | 门德语 | men |
Latn |
拉丁语模型 | |
| Middle English | 中古英语 | enm |
Latn |
拉丁语模型 | |
| Mittelhochdeutsch | 中古高地德语 | gmh |
Latn |
拉丁语模型 | |
| Baso Minangkabau, باسو مينڠكاباو | 米南佳保语 | min |
Latn |
拉丁语模型 | |
| Kanienʼkéha | 莫霍克语 | moh |
Latn |
拉丁语模型 | |
| Nkundu | Mongo | lol |
Latn |
拉丁语模型 | |
| Nāhuatl | 纳瓦特尔语 | nah |
Latn |
拉丁语模型 | |
| Diné bizaad | 纳瓦霍语 | nv |
Latn |
拉丁语模型 | |
| Ndonga | 恩东加语 | ng |
Latn |
拉丁语模型 | |
| ko e vagahau Niuē | 纽埃语 | niu |
Latn |
拉丁语模型 | |
| Zimbabwe Ndebele | 北恩德贝勒语 | nd |
Latn |
拉丁语模型 | |
| Sesotho sa Leboa | 北索托语 | nso |
Latn |
拉丁语模型 | |
| Chichewa, Chinyanja | 尼扬贾语 | ny |
Latn |
拉丁语模型 | |
| Runyankore | 尼扬科莱语 | nyn |
Latn |
拉丁语模型 | |
| Chitonga | 汤加语(尼亚萨地区) | tog |
Latn |
拉丁语模型 | |
| Appolo | 恩济马语 | nzi |
Latn |
拉丁语模型 | |
| Occitan, lenga d'òc, provençal | 奥克斯坦语 | oc |
Latn |
拉丁语模型 | |
| Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | 奥杰布瓦语 | oj |
Latn |
拉丁语模型 | |
| Ænglisc, Englisc, Anglisc | 古英语 | ang |
Latn |
拉丁语模型 | |
| Franceis, François, Romanz | 古法语 | fro |
Latn |
拉丁语模型 | |
| Diutisk, Althochdeutsch | 古高地德语 | goh |
Latn |
拉丁语模型 | |
| Dǫnsk tunga | 古诺斯语 | non |
Latn |
拉丁语模型 | |
| Occitan ancian | 古普罗文斯语 | pro |
Latn |
拉丁语模型 | |
| ирон ӕвзаг | 奥塞特语 | os |
Cyrl |
西里尔语模型 | |
| Kapampangan | 邦板牙语 | pam |
Latn |
拉丁语模型 | |
| Salitan Pangasinan | 邦阿西楠语 | pag |
Latn |
拉丁语模型 | |
| Papiamentu | 帕皮亚内托语 | pap |
Latn |
拉丁语模型 | |
| Português (Portugal) | 葡萄牙语(欧洲) | pt-PT |
Latn |
拉丁语模型 | |
| Kechua / Runa Simi | 克丘亚语 | qu |
Latn |
拉丁语模型 | |
| Rumantsch | 罗曼什语 | rm |
Latn |
拉丁语模型 | |
| Romani čhib | 吉普赛语 | rom |
Latn |
拉丁语模型 | |
| Ikirundi | 隆迪语 | rn |
Latn |
拉丁语模型 | |
| Sakha | 萨哈语 | sah |
Cyrl |
西里尔语模型 | |
| Gagana faʻa Sāmoa | 萨摩亚语 | sm |
Latn |
拉丁语模型 | |
| yângâ tî sängö | Sango | sg |
Latn |
拉丁语模型 | |
| (Braid) Scots, Lallans, Doric | 苏格兰语 | sco |
Latn |
拉丁语模型 | |
| Gàidhlig | 苏格兰盖尔语 | gd |
Latn |
拉丁语模型 | |
| chiShona | 修纳语 | sn |
Latn |
拉丁语模型 | |
| Songhay | Songhai | son |
Latn |
拉丁语模型 | |
| Sesotho | 南索托语 | st |
Latn |
拉丁语模型 | |
| Español (Latinoamérica) | 西班牙语(拉丁美洲) | es-419 |
Latn |
拉丁语模型 | |
| ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | 巽他语 | su |
Latn |
拉丁语模型 | |
| siSwati | 斯瓦特语 | ss |
Latn |
拉丁语模型 | |
| Reo Tahiti | 塔希提语 | ty |
Latn |
拉丁语模型 | |
| тоҷикӣ | 塔吉克语 | tg |
Cyrl |
西里尔语模型 | |
| татар теле | 鞑靼语 | tt |
Cyrl/Latn |
西里尔语模型 | |
| KʌThemnɛ | Temne | tem |
Latn |
拉丁语模型 | |
| lea faka-Tonga | 汤加语 | to |
Latn |
拉丁语模型 | |
| Xitsonga | 宗加语 | ts |
Latn |
拉丁语模型 | |
| Setswana | 茨瓦纳语 | tn |
Latn |
拉丁语模型 | |
| Türkmençe | 土库曼语 | tk |
Latn |
西里尔语模型 | |
| удмурт кыл | 乌德穆尔特人 | udm |
Cyrl |
西里尔语模型 | |
| Tshivenḓa | Venda | ve |
Latn |
拉丁语模型 | |
| Vod | 沃提克语 | vot |
Cyrl/Latn |
西里尔语模型 | |
| Frysk | 西弗里西亚语 | fy |
Latn |
拉丁语模型 | |
| Wolof | Wolof | wo |
Latn |
拉丁语模型 | |
| isiXhosa | 科萨语 | xh |
Latn |
拉丁语模型 | |
| Èdè Yorùbá | 约鲁巴语 | yo |
Latn |
拉丁语模型 | |
| Diidxazá | 萨波特克语 | zap |
Latn |
拉丁语模型 |
手写文字
以下文字支持手写识别。请查看上述语言表,了解使用每种文字的语言。
| 脚本 | 名称 | 支持级别 |
|---|---|---|
Beng |
孟加拉语 | 实验性 |
Cyrl |
西里尔文 | 实验性 |
Deva |
梵文 | 实验性 |
Grek |
希腊语 | 实验性 |
Hani |
中文 | 实验性 |
Jpan |
日语 | 支持 |
Kore |
韩语 | 支持 |
Latn |
拉丁语 | 支持 |
vi |
越南语 | 实验性 |