Modelo de traducción automática neuronal
El motor de reconocimiento de la API de Translation admite una amplia variedad de idiomas para el modelo de traducción automática neuronal (NMT).
Estos idiomas se especifican en una solicitud de reconocimiento con parámetros de códigos de idioma, como se indica en esta página. La mayoría de los parámetros de códigos de idioma se ajustan a los identificadores ISO‑639, excepto que se indique lo contrario.
Se admiten las traducciones entre cualquiera de los idiomas de esta lista. La romanización y la transliteración solo son compatibles con la API de Cloud Translation Avanzado. La lista se actualiza a medida que se agregan más idiomas. También puedes enumerar los idiomas compatibles con las APIs de Cloud Translation Básico o Cloud Translation Avanzado.
Pruébalo
Si es la primera vez que usas Google Cloud, crea una cuenta para evaluar el rendimiento de Cloud Translation en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
Probar Cloud Translation gratis
| Idioma | Código ISO-639 |
|---|---|
| Abjasio | ab |
| Achenés | ace |
| Acholí | ach |
| Afrikaans | af |
| Albanés | sq |
| Alur | alz |
| Amárico | am |
| Árabe | ar |
| Armenio | hy |
| Asamés | as |
| Awadhi | awa |
| Aimara | ay |
| Azerí | az |
| Balinés | ban |
| Bambara | bm |
| Baskir | ba |
| Euskara | eu |
| Karo | btx |
| Simalungun | bts |
| Toba | bbc |
| Bielorruso | be |
| Bemba | bem |
| Bengalí | bn |
| Betawi | bew |
| Bhojpuri | bho |
| Bikol | bik |
| Bosnio | bs |
| Bretón | br |
| Búlgaro | bg |
| Buriato | bua |
| Cantonés | yue |
| Catalán | ca |
| Cebuano | ceb |
| Chichewa (nyanja) | ny |
| Chino (simplificado) | zh-CN o zh (BCP-47) |
| Chino (Tradicional) | zh-TW (BCP-47) |
| Chuvasio | cv |
| Corso | co |
| Tártaro de Crimea | crh |
| Croata | hr |
| Checo | cs |
| Danés | da |
| Dinka | din |
| Divehi | dv |
| Dogri | doi |
| Ndombe | dov |
| Holandés | nl |
| Dzongkha | dz |
| Inglés | en |
| Esperanto | eo |
| Estonio | et |
| Ewe | ee |
| Fiyiano | fj |
| Filipino (tagalo) | fil o tl |
| Finés | fi |
| Francés | fr |
| Francés (Francia) | fr-FR |
| Francés (Canadá) | fr-CA |
| Frisón | fy |
| Fula | ff |
| Ga | gaa |
| Gallego | gl |
| Ganda (Luganda) | lg |
| Georgiano | ka |
| Alemán | de |
| Griego | el |
| Guaraní | gn |
| Guyaratí | gu |
| Criollo haitiano | ht |
| Chin de Hakha | cnh |
| Hausa | ha |
| Hawaiano | haw |
| Hebreo | iw o he |
| Hiligainón | hil |
| Hindi | hi |
| Hmong | hmn |
| Húngaro | hu |
| Hunsrik | hrx |
| Islandés | is |
| Igbo | ig |
| Ilocano | ilo |
| Indonesio | id |
| Irlandés | ga |
| Italiano | it |
| Japonés | ja |
| Javanés | jw o jv |
| Canarés | kn |
| Pampango | pam |
| Kazajo | kk |
| Jemer | km |
| Kiga | cgg |
| Kiñaruanda | rw |
| Kituba | ktu |
| Konkani | gom |
| Coreano | ko |
| Krio | kri |
| Kurdo (kurmanyi) | ku |
| Kurdo (sorani) | ckb |
| Kirguizo | ky |
| Laosiano | lo |
| Latgaliano | ltg |
| Latín | la |
| Letón | lv |
| Ligur | lij |
| Limburgués | li |
| Lingala | ln |
| Lituano | lt |
| Lombardo | lmo |
| Luo | luo |
| Luxemburgués | lb |
| Macedonio | mk |
| Maithili | mai |
| Makassar | mak |
| Malgache | mg |
| Malayo | ms |
| Malayo (jawi) | ms-Arab |
| Malabar | ml |
| Maltés | mt |
| Maorí | mi |
| Maratí | mr |
| Mari de las praderas | chm |
| Meiteilon (manipurí) | mni-Mtei |
| Minangkabau | min |
| Mizo | lus |
| Mongol | mn |
| Birmano | my |
| Ndebele del sur | nr |
| Nepal bhasa (newa) | new |
| Nepalí | ne |
| Soto norteño (sepedi) | nso |
| Noruego | no |
| Nuer | nus |
| Occitano | oc |
| Odia (oriya) | or |
| Oromo | om |
| Pangasinán | pag |
| Papiamento | pap |
| Pastún | ps |
| Persa | fa |
| Polaco | pl |
| Portugués | pt |
| Portugués (Portugal) | pt-PT |
| Portugués (Brasil) | pt-BR |
| Punyabí | pa |
| Panyabí (shahmují) | pa-Arab |
| Quechua | qu |
| Romaní | rom |
| Rumano | ro |
| Kirundi | rn |
| Ruso | ru |
| Samoano | sm |
| Sango | sg |
| Sánscrito | sa |
| Gaélico escocés | gd |
| Serbio | sr |
| Sesoto | st |
| Criollo seychelense | crs |
| Shan | shn |
| Shona | sn |
| Siciliano | scn |
| Silesio | szl |
| Sindhi | sd |
| Cingalés | si |
| Eslovaco | sk |
| Esloveno | sl |
| Somalí | so |
| Español | es |
| Sundanés | su |
| Suajili | sw |
| Suazi | ss |
| Sueco | sv |
| Tayiko | tg |
| Tamil | ta |
| Tártaro | tt |
| Telugu | te |
| Tetun | tet |
| Tailandés | th |
| Tigrinya | ti |
| Tsonga | ts |
| Setsuana | tn |
| Turco | tr |
| Turkmeno | tk |
| Twi (akan) | ak |
| Ucraniano | uk |
| Urdu | ur |
| Uigur | ug |
| Uzbeko | uz |
| Vietnamita | vi |
| Galés | cy |
| Xhosa | xh |
| Yiddish | yi |
| Yoruba | yo |
| Maya yucateco | yua |
| Zulú | zu |
Compatibilidad con la romanización y la transliteración
La romanización y la transliteración admiten los siguientes idiomas.
| Idioma | Código ISO-639 | Romanización | Transliteración |
|---|---|---|---|
| Árabe | ar |
||
| Amárico | am |
||
| Bengalí | bn |
||
| Bielorruso | be |
||
| Guyaratí | gu |
||
| Hindi | hi |
||
| Japonés | ja |
||
| Canarés | kn |
||
| Birmano | my |
||
| Ruso | ru |
||
| Serbio | sr |
||
| Tamil | ta |
||
| Telugu | te |
||
| Ucraniano | uk |
Modelos personalizados
Para Cloud Translation Advanced, AutoML Translation admite los siguientes pares de idiomas para modelos personalizados. Un idioma compatible significa que Google tiene un modelo de NMT (traducción automática neuronal) existente de ese idioma, que AutoML Translation usa como base con el objetivo de crear un modelo personalizado durante el entrenamiento.
| Par de idiomas | Códigos de idioma |
|---|---|
| Afrikáans <-> Inglés | af <-> en |
| Albanés <-> Inglés | sq <-> en |
| Árabe <-> Inglés | ar <-> en |
| Azerbaiyano <-> Inglés | az <-> en |
| Bengalí <-> Inglés | bn <-> en |
| Búlgaro <-> Inglés | bg <-> en |
| Catalán <-> Inglés | ca <-> en |
| Chino (simplificado) <-> Inglés | zh-CN * <-> en |
| Chino (tradicional) <-> Inglés | zh-TW <-> en |
| Croata <-> Inglés | hr <-> en |
| Checo <-> Inglés | cs <-> en |
| Danés <-> Inglés | da <-> en |
| Holandés <-> Inglés | nl <-> en |
| Estonio <-> Inglés | et <-> en |
| Finlandés <-> Inglés | fi <-> en |
| Francés <-> Inglés | fr <-> en |
| Gallego <-> Inglés | gl <-> en |
| Georgiano <-> Inglés | ka <-> en |
| Alemán <-> Inglés | de <-> en |
| Griego <-> Inglés | el <-> en |
| Guyaratí <-> Inglés | gu <-> en |
| Criollo haitiano <-> Inglés | ht <-> en |
| Hebreo <-> Inglés | iw <-> en |
| Hindi <-> Inglés | hi <-> en |
| Húngaro <-> Inglés | hu <-> en |
| Islandés <-> Inglés | is <-> en |
| Indonesio <-> Inglés | id <-> en |
| Italiano <-> Inglés | it <-> en |
| Japonés <-> Inglés | ja <-> en |
| Coreano <-> Inglés | ko <-> en |
| Letón <-> Inglés | lv <-> en |
| Lituano <-> Inglés | lt <-> en |
| Malayo <-> Inglés | ms <-> en |
| Maratí <-> Inglés | mr <-> en |
| Noruego <-> Inglés | no <-> en |
| Persa <-> Inglés | fa <-> en |
| Polaco <-> Inglés | pl <-> en |
| Portugués <-> Inglés | pt <-> en |
| Punyabí <-> Inglés | pa <-> en |
| Rumano <-> Inglés | ro <-> en |
| Ruso <-> Inglés | ru <-> en |
| Serbio <-> Inglés | sr <-> en |
| Eslovaco <-> Inglés | sk <-> en |
| Esloveno <-> Inglés | sl <-> en |
| Español <-> Inglés | es <-> en |
| Suajili <-> Inglés | sw <-> en |
| Sueco <-> Inglés | sv <-> en |
| Tailandés <-> Inglés | th <-> en |
| Turco <-> Inglés | tr <-> en |
| Ucraniano <-> Inglés | uk <-> en |
| Urdu <-> Inglés | ur <-> en |
| Vietnamita <-> Inglés | vi <-> en |
| Galés <-> Inglés | cy <-> en |
* El chino simplificado se puede especificar con zh-CN o
zh.
Códigos admitidos para variantes de idiomas
Los siguientes códigos de idioma son variantes de los idiomas admitidos en la tabla anterior. Puedes usar estos códigos como el idioma de origen o el idioma de destino cuando creas conjuntos de datos.
Google no tiene modelos de NMT base para estos idiomas. En su lugar, Cloud Translation usa el modelo base asociado de la variante de lenguaje para entrenar modelos personalizados.
Estos códigos son útiles, por ejemplo, cuando traduces contenido para un dialecto
o una región en particular. Por ejemplo, supongamos que localizaste datos para zh-HK en los
que creas un modelo personalizado. Cuando traduces, puedes especificar
el código de idioma zh-HK, que apunta a tu modelo personalizado y produce traducciones más
precisas para esa configuración regional.
En la siguiente tabla, se enumeran los códigos de idioma, sus descripciones y sus modelos base asociados que usa Cloud Translation cuando se entrenan modelos personalizados.
| Código de idioma | Descripción | Modelo base |
|---|---|---|
zh-HK |
Hong Kong (tradicional) | zh-TW |
Idiomas admitidos por el LLM de Translation
Se admiten las traducciones entre cualquiera de los idiomas de esta lista. Los idiomas que admite por el LLM de Translation también se admiten con la Traducción adaptable.
| Nombre del idioma | Código de idioma |
|---|---|
| Árabe | ar |
| Bengalí | bn |
| Búlgaro | bg |
| Catalán | ca |
| Chino (simplificado) | zh-CN |
| Croata | hr |
| Checo | cs |
| Danés | da |
| Holandés | nl |
| Inglés | en |
| Estonio | et |
| Finés | fi |
| Francés | fr |
| Alemán | de |
| Griego | el |
| Guyaratí | gu |
| Hebreo | he |
| Hindi | hi |
| Húngaro | hu |
| Islandés | is |
| Indonesio | id |
| Italiano | it |
| Japonés | ja |
| Canarés | kn |
| Coreano | ko |
| Letón | lv |
| Lituano | lt |
| Malabar | ml |
| Maratí | mr |
| Noruego | no |
| Persa | fa |
| Polaco | pl |
| Portugués | pt |
| Punyabí | pa |
| Rumano | ro |
| Ruso | ru |
| Eslovaco | sk |
| Esloveno | sl |
| Español | es |
| Suajili | sw |
| Sueco | sv |
| Tamil | ta |
| Telugu | te |
| Tailandés | th |
| Turco | tr |
| Ucraniano | uk |
| Urdu | ur |
| Vietnamita | vi |
| Zulú | zu |