A funcionalidade de reconhecimento de texto do Google Distributed Cloud (GDC) air-gapped deteta uma variedade de idiomas e pode detetar vários idiomas numa única imagem.
Pode especificar uma sugestão de idioma opcional para um pedido da API de reconhecimento ótico de carateres (OCR). Por exemplo, pode querer fornecer uma sugestão quando a API tiver problemas em detetar o idioma usado na sua imagem.
Para especificar sugestões de idiomas opcionais, adicione-as ao seu pedido BatchAnnotateImages
ou BatchAnnotateFiles
no campo image_context
como uma lista de valores no campo language_hints
.
O formato language_hints
usa as seguintes diretrizes de formatação de etiquetas de idioma BCP 47
:
language["-" script] ["-" region] *("-" variant) *("-" extension) ["-" privateuse]
Por exemplo, a sugestão de idioma en-t-i0-handwrit
indica que o idioma é "Inglês transformado a partir de escrita manual".
A funcionalidade de reconhecimento de texto suporta três níveis de idioma:
- Os idiomas suportados são priorizados com uma avaliação de desempenho regular.
- Os idiomas experimentais estão em desenvolvimento ativo. Não têm avaliações de desempenho regulares.
- Os idiomas mapeados são suportados através do respetivo mapeamento para outro código de idioma ou um reconhecedor de carateres geral. Por exemplo,
en-GB
é suportado, mas não é tratado de forma diferente deen
para reconhecimento de texto. O serviço de OCR tenta devolver o código de idioma mapeado correto no campoentity
. No entanto, é mais provável que os idiomas mapeados sejam identificados incorretamente do que os idiomas totalmente ou experimentalmente suportados.
Uma das principais funcionalidades do serviço de OCR é a capacidade de detetar e extrair texto de imagens. Uma imagem pode ser, por exemplo, texto manuscrito. Para ver uma lista de scripts de escrita manual suportados para reconhecimento de escrita manual, consulte o artigo Scripts de escrita manual.
Idiomas suportados
A funcionalidade de reconhecimento de texto dá prioridade e avalia regularmente os idiomas suportados. Para filtrar por idioma, escreva um idioma no seguinte campo:
Idioma | Idioma (nome em inglês) | Código de sugestões de idioma | Guião e notas |
---|---|---|---|
Afrikaans | Afrikaans | af |
Latn |
shqip | Albanês | sq |
Latn |
العربية | Árabe | ar |
Árabe; padrão moderno |
беларуская | Bielorrusso | be |
Cyrl |
български | Búlgaro | bg |
Cyrl |
Català | Catalão | ca |
Latn |
普通话 | Chinês | zh |
Hans/Hant |
Hrvatski | Croata | hr |
Latn |
Čeština | Chéquia | cs |
Latn |
Dansk | Dinamarquês | da |
Latn |
Nederlands | Neerlandês | nl |
Latn |
Inglês | Inglês | en |
Latn; Americano |
Eesti keel | Estónio | et |
Latn |
Filipino | Filipino | fil ou tl |
Latn |
Suomi | Finlandês | fi |
Latn |
Français | Francês | fr |
Latn; europeu |
Deutsch | Alemão | de |
Latn |
Ελληνικά | Grego | el |
Grek |
עברית | Hebraico | iw |
Hebr |
हिन्दी | Hindi | hi |
Deva |
Magyar | Húngaro | hu |
Latn |
Íslenska | Islandês | is |
Latn |
Bahasa Indonesia | Indonésio | id |
Latn |
Italiano | Italiano | it |
Latn |
日本語 | Japonês | ja |
Jpan |
한국어 | Coreano | ko |
Kore |
Latviešu | Letão | lv |
Latn |
Lietuvių | Lituânia | lt |
Latn |
Македонски | Macedónio | mk |
Cyrl |
Bahasa Melayu | Malaio | ms |
Latn |
മലയാളം | Malaiala | ml |
Mlym |
मराठी | Marati | mr |
Deva |
नेपाली | Nepalês | ne |
Deva |
Norsk | Norueguês | no |
Latn; Bokmål |
فارسی | Persa | fa |
Árabe |
Polski | Polaco | pl |
Latn |
Português | Português | pt |
Latn; brasileiro |
Română | Romeno | ro |
Latn |
Русский | Russo | ru |
Cyrl |
Русский (старая орфография) | Russo | ru-PETR1708 |
Cyrl; ortografia antiga |
Српски | Sérvio | sr |
Cyrl e Latn |
Српски (латиница) | Sérvio | sr-Latn |
Latn |
Slovenčina | Eslovaco | sk |
Latn |
Slovenščina | Esloveno | sl |
Latn |
Español | Espanhol | es |
Latn; europeu |
Svenska | Sueco | sv |
Latn |
Tagalo | Tagalo | tl |
Latn |
Türkçe | Turco | tr |
Latn |
Українська | Ucraniano | uk |
Cyrl |
Tiếng Việt | Vietnamita | vi |
Latn |
Iídiche | Iídiche | yi |
Hebr |
Idiomas experimentais
Os idiomas experimentais estão em desenvolvimento ativo e não são avaliados. Para filtrar por idioma, escreva um idioma no seguinte campo:
Idioma | Idioma (nome em inglês) | Código de sugestões de idioma | Guião e notas |
---|---|---|---|
Αρχαία ελληνικά | Grego antigo | grc |
Grek |
Azərbaycan | Azeri | az |
Latn |
Azərbaycan (qədim yazı) | Azeri | az-Cyrl |
Cirílico; ortografia antiga |
Euskara | Basco | eu |
Latn |
Bosanski | Bósnio | bs |
Latn |
Cebuano | Cebuano | ceb |
Latn |
Esperanto | Esperanto | eo |
Latn |
Galego | Galego | gl |
Latn |
ქართული | Georgiana | ka |
Geor |
Kreyòl Ayisyen | Crioulo haitiano | ht |
Latn |
Gaeilge | Irlandês | ga |
Latn |
Jawa | Javanês | jv |
Latn |
Қазақ | Cazaque | kk |
Cyrl |
Quirguiz | Quirguiz | ky |
Cyrl |
Latine | Latim | la |
Latn |
Malti | Maltês | mt |
Latn |
Монгол | Mongol | mn |
Cyrl |
پښتو | Pastó | ps |
Árabe |
संस्कृतम् | Sânscrito | sa |
Deva |
Suaíli | Suaíli | sw |
Latn |
اردو | Urdu | ur |
Árabe |
oʻzbekcha | Usbeque | uz |
Latn; latim |
oʻzbekcha | Usbeque | uz-Cyrl |
Cirílico; ortografia antiga |
Cymraeg | Galês | cy |
Latn |
IsiZulu | Zulu | zu |
Latn |
Idiomas mapeados
Os idiomas mapeados estão associados a outro código de idioma ou a um reconhecedor de carateres geral. Para filtrar por idioma, escreva um idioma no seguinte campo:
Idioma | Idioma (nome em inglês) | Código de sugestões de idioma | Guião e notas | Mapeado para |
---|---|---|---|---|
بهسا اچيه | Achém | ace |
Latn | Modelo de grafia latina |
Lwo | Acholi | ach |
Latn | Modelo de grafia latina |
Dangme | Adangme | ada |
Latn | Modelo de grafia latina |
Akan | Akan | ak |
Latn | Modelo de grafia latina |
Anicinâbemowin | Algonquinian | alg |
Latn | Modelo de grafia latina |
Mapudungu | Araucano/mapuche | arn |
Latn | Modelo de grafia latina |
Asturianu | Asturiano | ast |
Latn | Modelo de grafia latina |
Dene | Athabaskan | ath |
Latn | Modelo de grafia latina |
Aymar aru | Aimará | ay |
Latn | Modelo de grafia latina |
Bhāṣa Bali | Balinês | ban |
Latn | Modelo de grafia latina |
Bamanankan | Bambara | bm |
Latn | Modelo de grafia latina |
Bantu estreito | Bantu | bnt |
Latn | Modelo de grafia latina |
башҡорт теле | Bashkir | ba |
Cyrl | Modelo de script cirílico |
Toba-bataque | Bataque | btk |
Latn | Modelo de grafia latina |
Chibemba | Bemba | bem |
Latn | Modelo de grafia latina |
Bikol Naga | Bikol | bik |
Latn | Modelo de grafia latina |
Bichelamar | Bislama | bi |
Latn | Modelo de grafia latina |
Brezhoneg | Bretão | br |
Latn | Modelo de grafia latina |
нохчийн мотт / noxçiyn mott | Checheno | ce |
Cyrl | Modelo de script cirílico |
汉语 | Chinês | zh-Hans |
Hans; simplificado; mandarim | zh |
漢語 | Chinês | zh-Hant |
Hant; tradicional; mandarim | zh |
普通話 | Chinês | zh-Hant-HK |
Hant; mandarim; Hong Kong | zh |
Chahta' | Choctaw | cho |
Latn | Modelo de grafia latina |
Чӑвашла | Chuvache | cv |
Cyrl | Modelo de script cirílico |
Cree–Montagnais–Naskapi | Cree | cr |
Latn | Modelo de grafia latina |
Mvskoke | Riacho | mus |
Latn | Modelo de grafia latina |
qırımtatar tili, къырымтатар тили | Tártaro da Crimeia | crh |
Latn | Modelo de script cirílico |
Dakhótiyapi, Dakȟótiyapi | Dacota | dak |
Latn | Modelo de grafia latina |
Douala | Duala | dua |
Latn | Modelo de grafia latina |
Ikɔ Efik | Efik | efi |
Latn | Modelo de grafia latina |
Inglês (Reino Unido) | Inglês | en-GB |
Latn; British | pt-PT |
Èʋegbe | Ewe | ee |
Latn | Modelo de grafia latina |
føroyskt mál | Faroé | fo |
Latn | Modelo de grafia latina |
Na Vosa Vakaviti | Fijiano | fj |
Latn | Modelo de grafia latina |
fɔ̀ngbè | Fon | fon |
Latn | Modelo de grafia latina |
Français canadien | Francês | fr-CA |
Latn; canadiano | fr |
Fulani, Fula, Peul | Fula | ff |
Latn | Modelo de grafia latina |
Gã | Ga | gaa |
Latn | Modelo de grafia latina |
Luganda | Ganda | lg |
Latn | Modelo de grafia latina |
Basa Gayo | Gayo | gay |
Latn | Modelo de grafia latina |
Quiribáti | Gilbertês | gil |
Latn | Modelo de grafia latina |
Gótico | Gótico | got |
Latn | Modelo de grafia latina |
Guarani | Guarani | gn |
Latn | Modelo de grafia latina |
Harshen/Halshen Hausa هَرْشَن هَوْسَ | Haúça | ha |
Latn | Modelo de grafia latina |
ʻŌlelo Hawaiʻi | Havaiano | haw |
Latn | Modelo de grafia latina |
Otjiherero | Herero | hz |
Latn | Modelo de grafia latina |
Ilonggo | Hiligaynon | hil |
Latn | Modelo de grafia latina |
Jaku Iban | Iban | iba |
Latn | Modelo de grafia latina |
Asụsụ Igbo | Igbo | ig |
Latn | Modelo de grafia latina |
Ilocano | Ilocano | ilo |
Latn | Modelo de grafia latina |
Taqbaylit | Cabila | kab |
Latn | Modelo de grafia latina |
Jingpho | Kachin | kac |
Latn | Modelo de grafia latina |
Kalaallisut | Kalaallisut | kl |
Latn | Modelo de grafia latina |
Kikamba | Kikamba | kam |
Latn | Modelo de grafia latina |
Kanuri | Kanuri | kr |
Latn | Modelo de grafia latina |
Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | Caracalpaque | kaa |
Cyrl/Latn | Modelo de script cirílico |
Ka Ktien Khasi | Khasi | kha |
Latn | Modelo de grafia latina |
Gĩkũyũ | Kikuyu | ki |
Latn | Modelo de grafia latina |
Kinyarwanda | Kinyarwanda | rw |
Latn | Modelo de grafia latina |
коми кыв | Komi | kv |
Cyrl | Modelo de script cirílico |
Quicongo | Conguês | kg |
Latn | Modelo de grafia latina |
Kosraean | Kosraean | kos |
Latn | Modelo de grafia latina |
Oshikwanyama | Cuanhama | kj |
Latn | Modelo de grafia latina |
Ngala | Lingala | ln |
Latn | Modelo de grafia latina |
Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds |
Latn | Modelo de grafia latina |
siLozi | Lozi | loz |
Latn | Modelo de grafia latina |
Kiluba | Luba-katanga | lu |
Latn | Modelo de grafia latina |
Dholuo | Luo | luo |
Latn | Modelo de grafia latina |
Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad |
Latn | Modelo de grafia latina |
Malgaxe | Malgaxe | mg |
Latn | Modelo de grafia latina |
Mandinka, لغة مندنكا | Mandingo | man |
Latn | Modelo de grafia latina |
Gaelg, Gailck | Manquês | gv |
Latn | Modelo de grafia latina |
Te reo Māori | Maori | mi |
Latn | Modelo de grafia latina |
Ebon | Marshalês | mh |
Latn | Modelo de grafia latina |
Mɛnde yia | Mende | men |
Latn | Modelo de grafia latina |
Inglês médio | Inglês médio | enm |
Latn | Modelo de grafia latina |
Mittelhochdeutsch | Alto-alemão médio | gmh |
Latn | Modelo de grafia latina |
Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min |
Latn | Modelo de grafia latina |
Kanienʼkéha | Mohawk | moh |
Latn | Modelo de grafia latina |
Nkundu | Mongo | lol |
Latn | Modelo de grafia latina |
Nāhuatl | Nauatle | nah |
Latn | Modelo de grafia latina |
Diné bizaad | Navajo | nv |
Latn | Modelo de grafia latina |
Ndonga | Ndonga | ng |
Latn | Modelo de grafia latina |
ko e vagahau Niuē | Niueano | niu |
Latn | Modelo de grafia latina |
Ndebele do Zimbabué | Ndebele do norte | nd |
Latn | Modelo de grafia latina |
Sesotho sa Leboa | Soto do Norte | nso |
Latn | Modelo de grafia latina |
Cinianja | Nianja | ny |
Latn | Modelo de grafia latina |
Runyankore | Nyankole | nyn |
Latn | Modelo de grafia latina |
Tonga | Nyasa tonga | tog |
Latn | Modelo de grafia latina |
Appolo | Nzima | nzi |
Latn | Modelo de grafia latina |
Occitano, lenga d'òc, provençal | Occitânico | oc |
Latn | Modelo de grafia latina |
Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojíbua | oj |
Latn | Modelo de grafia latina |
Ænglisc, Englisc, Anglisc | Inglês antigo | ang |
Latn | Modelo de grafia latina |
Franceis, François, Romanz | Francês antigo | fro |
Latn | Modelo de grafia latina |
Diutisk, Althochdeutsch | Alto-alemão antigo | goh |
Latn | Modelo de grafia latina |
Dǫnsk tunga | Nórdico antigo | non |
Latn | Modelo de grafia latina |
Occitano antigo | Provençal antigo | pro |
Latn | Modelo de grafia latina |
ирон ӕвзаг | Osseta | os |
Cyrl | Modelo de script cirílico |
Kapampangan | Pampanga | pam |
Latn | Modelo de grafia latina |
Salitan Pangasinan | Pangasinês | pag |
Latn | Modelo de grafia latina |
Papiamentu | Papiamento | pap |
Latn | Modelo de grafia latina |
Português (Portugal) | Português | pt-PT |
Latn; europeu | pt |
Quíchua / Runa Simi | Quíchua | qu |
Latn | Modelo de grafia latina |
Rumantsch | Romanche | rm |
Latn | Modelo de grafia latina |
Romani čhib | Romani | rom |
Latn | Modelo de grafia latina |
Ikirundi | Rundi | rn |
Latn | Modelo de grafia latina |
Sakha | Sakha | sah |
Cyrl | Modelo de script cirílico |
Gagana faʻa Sāmoa | Samoano | sm |
Latn | Modelo de grafia latina |
yângâ tî sängö | Sango | sg |
Latn | Modelo de grafia latina |
Escocês (Braid), Lallans, dórico | Escocês | sco |
Latn | Modelo de grafia latina |
Gàidhlig | Gaélico Escocês | gd |
Latn | Modelo de grafia latina |
chiShona | Shona | sn |
Latn | Modelo de grafia latina |
Songhay | Songai | son |
Latn | Modelo de grafia latina |
Sesoto | Sesoto | st |
Latn | Modelo de grafia latina |
Español (Latinoamérica) | Espanhol | es-419 |
Latn; latino-americano | es |
ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su |
Latn | Modelo de grafia latina |
siSwati | Suazi | ss |
Latn | Modelo de grafia latina |
Reo Tahiti | Taitiano | ty |
Latn | Modelo de grafia latina |
тоҷикӣ | Tajique | tg |
Cyrl | Modelo de script cirílico |
татар теле | Tártaro | tt |
Cyrl/Latn | Modelo de script cirílico |
KʌThemnɛ | Temne | tem |
Latn | Modelo de grafia latina |
lea faka-Tonga | Tonga | to |
Latn | Modelo de grafia latina |
Tsonga | Tsonga | ts |
Latn | Modelo de grafia latina |
Setswana | Tsuana | tn |
Latn | Modelo de grafia latina |
Türkmençe | Turcomenistão | tk |
Latn | Modelo de script cirílico |
удмурт кыл | Udmurte | udm |
Cyrl | Modelo de script cirílico |
Tshivenḓa | Venda | ve |
Latn | Modelo de grafia latina |
VOD | Vótico | vot |
Cyrl/Latn | Modelo de script cirílico |
Frysk | Frísico ocidental | fy |
Latn | Modelo de grafia latina |
Jalofo | Jalofo | wo |
Latn | Modelo de grafia latina |
isiXhosa | Xhosa | xh |
Latn | Modelo de grafia latina |
Èdè Yorùbá | Iorubá | yo |
Latn | Modelo de grafia latina |
Diidxazá | Zapoteca | zap |
Latn | Modelo de grafia latina |
Scripts de escrita manual
Esta secção contém os scripts suportados para o reconhecimento de escrita manual. Para saber que idiomas usam cada script, consulte as tabelas de idiomas suportados, experimentais e mapeados. Para filtrar por guião, escreva um guião no campo seguinte:
Etiqueta de script | Nome | Nível de apoio técnico |
---|---|---|
Beng | Bengali | Experimental |
Cyrl | Cirílico | Experimental |
Deva | Devanagari | Experimental |
Grek | Grego | Experimental |
Hani | Chinês | Experimental |
Jpan | Japonês | Suportado |
Kore | Coreano | Suportado |
Latn | Latim | Suportado |
vi | Vietnamita | Experimental |