Idiomas suportados

A funcionalidade de reconhecimento de texto do Google Distributed Cloud (GDC) air-gapped deteta uma variedade de idiomas e pode detetar vários idiomas numa única imagem.

Pode especificar uma sugestão de idioma opcional para um pedido da API de reconhecimento ótico de carateres (OCR). Por exemplo, pode querer fornecer uma sugestão quando a API tiver problemas em detetar o idioma usado na sua imagem.

Para especificar sugestões de idiomas opcionais, adicione-as ao seu pedido BatchAnnotateImages ou BatchAnnotateFiles no campo image_context como uma lista de valores no campo language_hints.

O formato language_hints usa as seguintes diretrizes de formatação de etiquetas de idioma BCP 47:

language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]

Por exemplo, a sugestão de idioma en-t-i0-handwrit indica que o idioma é "Inglês transformado a partir de escrita manual".

A funcionalidade de reconhecimento de texto suporta três níveis de idioma:

  1. Os idiomas suportados são priorizados com uma avaliação de desempenho regular.
  2. Os idiomas experimentais estão em desenvolvimento ativo. Não têm avaliações de desempenho regulares.
  3. Os idiomas mapeados são suportados através do respetivo mapeamento para outro código de idioma ou um reconhecedor de carateres geral. Por exemplo, en-GB é suportado, mas não é tratado de forma diferente de en para reconhecimento de texto. O serviço de OCR tenta devolver o código de idioma mapeado correto no campo entity. No entanto, é mais provável que os idiomas mapeados sejam identificados incorretamente do que os idiomas totalmente ou experimentalmente suportados.

Uma das principais funcionalidades do serviço de OCR é a capacidade de detetar e extrair texto de imagens. Uma imagem pode ser, por exemplo, texto manuscrito. Para ver uma lista de scripts de escrita manual suportados para reconhecimento de escrita manual, consulte o artigo Scripts de escrita manual.

Idiomas suportados

A funcionalidade de reconhecimento de texto dá prioridade e avalia regularmente os idiomas suportados. Para filtrar por idioma, escreva um idioma no seguinte campo:

Idioma Idioma (nome em inglês) Código de sugestões de idioma Guião e notas
Afrikaans Afrikaans af Latn
shqip Albanês sq Latn
العربية Árabe ar Árabe; padrão moderno
беларуская Bielorrusso be Cyrl
български Búlgaro bg Cyrl
Català Catalão ca Latn
普通话 Chinês zh Hans/Hant
Hrvatski Croata hr Latn
Čeština Chéquia cs Latn
Dansk Dinamarquês da Latn
Nederlands Neerlandês nl Latn
Inglês Inglês en Latn; Americano
Eesti keel Estónio et Latn
Filipino Filipino fil ou tl Latn
Suomi Finlandês fi Latn
Français Francês fr Latn; europeu
Deutsch Alemão de Latn
Ελληνικά Grego el Grek
עברית Hebraico iw Hebr
हिन्दी Hindi hi Deva
Magyar Húngaro hu Latn
Íslenska Islandês is Latn
Bahasa Indonesia Indonésio id Latn
Italiano Italiano it Latn
日本語 Japonês ja Jpan
한국어 Coreano ko Kore
Latviešu Letão lv Latn
Lietuvių Lituânia lt Latn
Македонски Macedónio mk Cyrl
Bahasa Melayu Malaio ms Latn
മലയാളം Malaiala ml Mlym
मराठी Marati mr Deva
नेपाली Nepalês ne Deva
Norsk Norueguês no Latn; Bokmål
فارسی Persa fa Árabe
Polski Polaco pl Latn
Português Português pt Latn; brasileiro
Română Romeno ro Latn
Русский Russo ru Cyrl
Русский (старая орфография) Russo ru-PETR1708 Cyrl; ortografia antiga
Српски Sérvio sr Cyrl e Latn
Српски (латиница) Sérvio sr-Latn Latn
Slovenčina Eslovaco sk Latn
Slovenščina Esloveno sl Latn
Español Espanhol es Latn; europeu
Svenska Sueco sv Latn
Tagalo Tagalo tl Latn
Türkçe Turco tr Latn
Українська Ucraniano uk Cyrl
Tiếng Việt Vietnamita vi Latn
Iídiche Iídiche yi Hebr

Idiomas experimentais

Os idiomas experimentais estão em desenvolvimento ativo e não são avaliados. Para filtrar por idioma, escreva um idioma no seguinte campo:

Idioma Idioma (nome em inglês) Código de sugestões de idioma Guião e notas
Αρχαία ελληνικά Grego antigo grc Grek
Azərbaycan Azeri az Latn
Azərbaycan (qədim yazı) Azeri az-Cyrl Cirílico; ortografia antiga
Euskara Basco eu Latn
Bosanski Bósnio bs Latn
Cebuano Cebuano ceb Latn
Esperanto Esperanto eo Latn
Galego Galego gl Latn
ქართული Georgiana ka Geor
Kreyòl Ayisyen Crioulo haitiano ht Latn
Gaeilge Irlandês ga Latn
Jawa Javanês jv Latn
Қазақ Cazaque kk Cyrl
Quirguiz Quirguiz ky Cyrl
Latine Latim la Latn
Malti Maltês mt Latn
Монгол Mongol mn Cyrl
پښتو Pastó ps Árabe
संस्कृतम् Sânscrito sa Deva
Suaíli Suaíli sw Latn
اردو Urdu ur Árabe
oʻzbekcha Usbeque uz Latn; latim
oʻzbekcha Usbeque uz-Cyrl Cirílico; ortografia antiga
Cymraeg Galês cy Latn
IsiZulu Zulu zu Latn

Idiomas mapeados

Os idiomas mapeados estão associados a outro código de idioma ou a um reconhecedor de carateres geral. Para filtrar por idioma, escreva um idioma no seguinte campo:

Idioma Idioma (nome em inglês) Código de sugestões de idioma Guião e notas Mapeado para
بهسا اچيه Achém ace Latn Modelo de grafia latina
Lwo Acholi ach Latn Modelo de grafia latina
Dangme Adangme ada Latn Modelo de grafia latina
Akan Akan ak Latn Modelo de grafia latina
Anicinâbemowin Algonquinian alg Latn Modelo de grafia latina
Mapudungu Araucano/mapuche arn Latn Modelo de grafia latina
Asturianu Asturiano ast Latn Modelo de grafia latina
Dene Athabaskan ath Latn Modelo de grafia latina
Aymar aru Aimará ay Latn Modelo de grafia latina
Bhāṣa Bali Balinês ban Latn Modelo de grafia latina
Bamanankan Bambara bm Latn Modelo de grafia latina
Bantu estreito Bantu bnt Latn Modelo de grafia latina
башҡорт теле Bashkir ba Cyrl Modelo de script cirílico
Toba-bataque Bataque btk Latn Modelo de grafia latina
Chibemba Bemba bem Latn Modelo de grafia latina
Bikol Naga Bikol bik Latn Modelo de grafia latina
Bichelamar Bislama bi Latn Modelo de grafia latina
Brezhoneg Bretão br Latn Modelo de grafia latina
нохчийн мотт / noxçiyn mott Checheno ce Cyrl Modelo de script cirílico
汉语 Chinês zh-Hans Hans; simplificado; mandarim zh
漢語 Chinês zh-Hant Hant; tradicional; mandarim zh
普通話 Chinês zh-Hant-HK Hant; mandarim; Hong Kong zh
Chahta' Choctaw cho Latn Modelo de grafia latina
Чӑвашла Chuvache cv Cyrl Modelo de script cirílico
Cree–Montagnais–Naskapi Cree cr Latn Modelo de grafia latina
Mvskoke Riacho mus Latn Modelo de grafia latina
qırımtatar tili, къырымтатар тили Tártaro da Crimeia crh Latn Modelo de script cirílico
Dakhótiyapi, Dakȟótiyapi Dacota dak Latn Modelo de grafia latina
Douala Duala dua Latn Modelo de grafia latina
Ikɔ Efik Efik efi Latn Modelo de grafia latina
Inglês (Reino Unido) Inglês en-GB Latn; British pt-PT
Èʋegbe Ewe ee Latn Modelo de grafia latina
føroyskt mál Faroé fo Latn Modelo de grafia latina
Na Vosa Vakaviti Fijiano fj Latn Modelo de grafia latina
fɔ̀ngbè Fon fon Latn Modelo de grafia latina
Français canadien Francês fr-CA Latn; canadiano fr
Fulani, Fula, Peul Fula ff Latn Modelo de grafia latina
Ga gaa Latn Modelo de grafia latina
Luganda Ganda lg Latn Modelo de grafia latina
Basa Gayo Gayo gay Latn Modelo de grafia latina
Quiribáti Gilbertês gil Latn Modelo de grafia latina
Gótico Gótico got Latn Modelo de grafia latina
Guarani Guarani gn Latn Modelo de grafia latina
Harshen/Halshen Hausa هَرْشَن هَوْسَ Haúça ha Latn Modelo de grafia latina
ʻŌlelo Hawaiʻi Havaiano haw Latn Modelo de grafia latina
Otjiherero Herero hz Latn Modelo de grafia latina
Ilonggo Hiligaynon hil Latn Modelo de grafia latina
Jaku Iban Iban iba Latn Modelo de grafia latina
Asụsụ Igbo Igbo ig Latn Modelo de grafia latina
Ilocano Ilocano ilo Latn Modelo de grafia latina
Taqbaylit Cabila kab Latn Modelo de grafia latina
Jingpho Kachin kac Latn Modelo de grafia latina
Kalaallisut Kalaallisut kl Latn Modelo de grafia latina
Kikamba Kikamba kam Latn Modelo de grafia latina
Kanuri Kanuri kr Latn Modelo de grafia latina
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى Caracalpaque kaa Cyrl/Latn Modelo de script cirílico
Ka Ktien Khasi Khasi kha Latn Modelo de grafia latina
Gĩkũyũ Kikuyu ki Latn Modelo de grafia latina
Kinyarwanda Kinyarwanda rw Latn Modelo de grafia latina
коми кыв Komi kv Cyrl Modelo de script cirílico
Quicongo Conguês kg Latn Modelo de grafia latina
Kosraean Kosraean kos Latn Modelo de grafia latina
Oshikwanyama Cuanhama kj Latn Modelo de grafia latina
Ngala Lingala ln Latn Modelo de grafia latina
Plattdütsch, Plattdeutsch, Nedersaksisch Baixo-alemão nds Latn Modelo de grafia latina
siLozi Lozi loz Latn Modelo de grafia latina
Kiluba Luba-katanga lu Latn Modelo de grafia latina
Dholuo Luo luo Latn Modelo de grafia latina
Madhura, Basa Mathura, بَهاسَ مَدورا Madurês mad Latn Modelo de grafia latina
Malgaxe Malgaxe mg Latn Modelo de grafia latina
Mandinka, لغة مندنكا Mandingo man Latn Modelo de grafia latina
Gaelg, Gailck Manquês gv Latn Modelo de grafia latina
Te reo Māori Maori mi Latn Modelo de grafia latina
Ebon Marshalês mh Latn Modelo de grafia latina
Mɛnde yia Mende men Latn Modelo de grafia latina
Inglês médio Inglês médio enm Latn Modelo de grafia latina
Mittelhochdeutsch Alto-alemão médio gmh Latn Modelo de grafia latina
Baso Minangkabau, باسو مينڠكاباو Minangkabau min Latn Modelo de grafia latina
Kanienʼkéha Mohawk moh Latn Modelo de grafia latina
Nkundu Mongo lol Latn Modelo de grafia latina
Nāhuatl Nauatle nah Latn Modelo de grafia latina
Diné bizaad Navajo nv Latn Modelo de grafia latina
Ndonga Ndonga ng Latn Modelo de grafia latina
ko e vagahau Niuē Niueano niu Latn Modelo de grafia latina
Ndebele do Zimbabué Ndebele do norte nd Latn Modelo de grafia latina
Sesotho sa Leboa Soto do Norte nso Latn Modelo de grafia latina
Cinianja Nianja ny Latn Modelo de grafia latina
Runyankore Nyankole nyn Latn Modelo de grafia latina
Tonga Nyasa tonga tog Latn Modelo de grafia latina
Appolo Nzima nzi Latn Modelo de grafia latina
Occitano, lenga d'òc, provençal Occitânico oc Latn Modelo de grafia latina
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ Ojíbua oj Latn Modelo de grafia latina
Ænglisc, Englisc, Anglisc Inglês antigo ang Latn Modelo de grafia latina
Franceis, François, Romanz Francês antigo fro Latn Modelo de grafia latina
Diutisk, Althochdeutsch Alto-alemão antigo goh Latn Modelo de grafia latina
Dǫnsk tunga Nórdico antigo non Latn Modelo de grafia latina
Occitano antigo Provençal antigo pro Latn Modelo de grafia latina
ирон ӕвзаг Osseta os Cyrl Modelo de script cirílico
Kapampangan Pampanga pam Latn Modelo de grafia latina
Salitan Pangasinan Pangasinês pag Latn Modelo de grafia latina
Papiamentu Papiamento pap Latn Modelo de grafia latina
Português (Portugal) Português pt-PT Latn; europeu pt
Quíchua / Runa Simi Quíchua qu Latn Modelo de grafia latina
Rumantsch Romanche rm Latn Modelo de grafia latina
Romani čhib Romani rom Latn Modelo de grafia latina
Ikirundi Rundi rn Latn Modelo de grafia latina
Sakha Sakha sah Cyrl Modelo de script cirílico
Gagana faʻa Sāmoa Samoano sm Latn Modelo de grafia latina
yângâ tî sängö Sango sg Latn Modelo de grafia latina
Escocês (Braid), Lallans, dórico Escocês sco Latn Modelo de grafia latina
Gàidhlig Gaélico Escocês gd Latn Modelo de grafia latina
chiShona Shona sn Latn Modelo de grafia latina
Songhay Songai son Latn Modelo de grafia latina
Sesoto Sesoto st Latn Modelo de grafia latina
Español (Latinoamérica) Espanhol es-419 Latn; latino-americano es
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda Sundanês su Latn Modelo de grafia latina
siSwati Suazi ss Latn Modelo de grafia latina
Reo Tahiti Taitiano ty Latn Modelo de grafia latina
тоҷикӣ Tajique tg Cyrl Modelo de script cirílico
татар теле Tártaro tt Cyrl/Latn Modelo de script cirílico
KʌThemnɛ Temne tem Latn Modelo de grafia latina
lea faka-Tonga Tonga to Latn Modelo de grafia latina
Tsonga Tsonga ts Latn Modelo de grafia latina
Setswana Tsuana tn Latn Modelo de grafia latina
Türkmençe Turcomenistão tk Latn Modelo de script cirílico
удмурт кыл Udmurte udm Cyrl Modelo de script cirílico
Tshivenḓa Venda ve Latn Modelo de grafia latina
VOD Vótico vot Cyrl/Latn Modelo de script cirílico
Frysk Frísico ocidental fy Latn Modelo de grafia latina
Jalofo Jalofo wo Latn Modelo de grafia latina
isiXhosa Xhosa xh Latn Modelo de grafia latina
Èdè Yorùbá Iorubá yo Latn Modelo de grafia latina
Diidxazá Zapoteca zap Latn Modelo de grafia latina

Scripts de escrita manual

Esta secção contém os scripts suportados para o reconhecimento de escrita manual. Para saber que idiomas usam cada script, consulte as tabelas de idiomas suportados, experimentais e mapeados. Para filtrar por guião, escreva um guião no campo seguinte:

Etiqueta de script Nome Nível de apoio técnico
Beng Bengali Experimental
Cyrl Cirílico Experimental
Deva Devanagari Experimental
Grek Grego Experimental
Hani Chinês Experimental
Jpan Japonês Suportado
Kore Coreano Suportado
Latn Latim Suportado
vi Vietnamita Experimental