Cloud Vision API のテキスト認識機能では、多様な言語を検出でき、1 つの画像内の複数の言語を検出できます。
サービスに言語のヒントを提供することは必須ではありませんが、サービスで画像に使用されている言語の検出が困難な場合に行うことができます。
手書き OCR 一般提供のリリースに伴い、DOCUMENT_TEXT_DETECTION を使用する場合、手書き文字の含まれた画像には手書き languageHints フラグが不要になりました。
言語ヒント(省略可能)は、TEXT_DETECTION および DOCUMENT_TEXT_DETECTION リクエストに関して、リクエストの ImageContext 内に languageHints リストとして指定します。
各言語コード パラメータは一般に BCP-47 識別子で構成されています。このパラメータでは、言語-地域の形式が可能です。ここで、言語は第一言語を表し、地域(省略可能)は特定の言語の地域(通常は国の識別子)を表します。たとえば、中国語は中華人民共和国で使用される簡体中国語(zh-Hans)、または台湾で使用される繁体中国語(zh-Hant)で表されます。
テキスト認識機能には、次の 3 段階の言語サポートがあります。
- サポート対象言語は、優先して定期的にパフォーマンスを評価されます。
- 試験運用言語は開発が積極的に進められていますが、定期的に評価されません。
- マッピング言語とは、別の言語コードや一般的な文字認識ツールにマッピングすることでサポートされる言語です。たとえば、「
en-GB」はサポートされていますが、文字認識においては「en」と同様に扱われます。エンティティのロケール フィールドで正しいマッピング言語コードを返すよう最善を尽くしますが、マッピング言語は完全にサポートされている言語や試験運用でサポートされている言語よりも、類似した言語として誤って認識される可能性があります。
TEXT_DETECTION と DOCUMENT_TEXT_DETECTION でサポートされる言語のリスト(および関連する languageHint コード)は、以下のとおりです。
言語ヒントが空白の場合、最適な言語の自動検出を試みます。TEXT_DETECTION エンドポイントは、サポートされている言語のサブセットのみを自動検出します。一方、DOCUMENT_TEXT_DETECTION エンドポイントは、サポートされているすべての言語を自動検出します。
サポートされている言語
次の言語は優先され、定期的に評価されます。
機能別でフィルタするには、目的の言語を入力するか、プルダウン メニューから選択します。
| 言語 | 言語(日本語名) | languageHints コード |
スクリプト | メモ | |
|---|---|---|---|---|---|
| Afrikaans | アフリカーンス語 | af |
Latn |
||
| shqip | アルバニア語 | sq |
Latn |
||
| العربية | アラビア語 | ar |
Arab |
現代標準 | |
| Հայ | アルメニア語 | hy |
Armn |
||
| беларуская | ベラルーシ語 | be |
Cyrl |
||
| বাংলা | ベンガル語 | bn |
Beng |
||
| български | ブルガリア語 | bg |
Cyrl |
||
| Català | カタロニア語 | ca |
Latn |
||
| 普通话 | 中国語 | zh |
Hans/Hant |
||
| Hrvatski | クロアチア語 | hr |
Latn |
||
| Čeština | チェコ語 | cs |
Latn |
||
| Dansk | デンマーク語 | da |
Latn |
||
| Nederlands | オランダ語 | nl |
Latn |
||
| English | 英語 | en |
Latn |
米国 | |
| Eesti keel | エストニア語 | et |
Latn |
||
| Filipino | フィリピン語 | fil |
Latn |
||
| Suomi | フィンランド語 | fi |
Latn |
||
| Français | フランス語 | fr |
Latn |
ヨーロッパ | |
| Deutsch | ドイツ語 | de |
Latn |
||
| Ελληνικά | ギリシャ語 | el |
Grek |
||
| ગુજરાતી | グジャラト語 | gu |
Gujr |
||
| עברית | ヘブライ語 | iw |
Hebr |
||
| हिन्दी | ヒンディー語 | hi |
Deva |
||
| Magyar | ハンガリー語 | hu |
Latn |
||
| Íslenska | アイスランド語 | is |
Latn |
||
| Bahasa Indonesia | インドネシア語 | id |
Latn |
||
| Italiano | イタリア語 | it |
Latn |
||
| 日本語 | 日本語 | ja |
Jpan |
||
| ಕನ್ನಡ | カンナダ語 | kn |
Knda |
||
| ភាសាខ្មែរ | クメール語 | km |
Khmr |
||
| 한국어 | 韓国語 | ko |
Kore |
||
| ລາວ | ラオ語 | lo |
Laoo |
||
| Latviešu | ラトビア語 | lv |
Latn |
||
| Lietuvių | リトアニア語 | lt |
Latn |
||
| Македонски | マケドニア語 | mk |
Cyrl |
||
| Bahasa Melayu | マレー語 | ms |
Latn |
||
| മലയാളം | マラヤーラム文字 | ml |
Mlym |
||
| मराठी | マラーティー語 | mr |
Deva |
||
| नेपाली | ネパール語 | ne |
Deva |
||
| Norsk | ノルウェー語 | no |
Latn |
ノルウェー語(ブークモール) | |
| فارسی | ペルシャ語 | fa |
Arab |
||
| Polski | ポーランド語 | pl |
Latn |
||
| Português | ポルトガル語 | pt |
Latn |
ブラジル | |
| ਪੰਜਾਬੀ | パンジャブ語 | pa |
Guru |
グルムキー文字 | |
| Română | ルーマニア語 | ro |
Latn |
||
| Русский | ロシア語 | ru |
Cyrl |
||
| Русский (старая орфография) | ロシア語 | ru-PETR1708 |
Cyrl |
旧正書法 | |
| Српски | セルビア語 | sr |
Cyrl |
||
| Српски (латиница) | セルビア語 | sr-Latn |
Latn |
||
| Slovenčina | スロバキア語 | sk |
Latn |
||
| Slovenščina | スロベニア語 | sl |
Latn |
||
| Español | スペイン語 | es |
Latn |
ヨーロッパ | |
| Svenska | スウェーデン語 | sv |
Latn |
||
| Tagalog | タガログ語 | tl |
Latn |
||
| தமிழ் | タミル語 | ta |
Taml |
||
| తెలుగు | テルグ語 | te |
Telu |
||
| ไทย | タイ語 | th |
Thai |
||
| Türkçe | トルコ語 | tr |
Latn |
||
| Українська | ウクライナ語 | uk |
Cyrl |
||
| Tiếng Việt | ベトナム語 | vi |
Latn |
||
| Yiddish | イディッシュ語 | yi |
Hebr |
試験運用版の言語
次の言語は現在開発が積極的に進められている最中ですが、まだ定期的に評価されていません。
| 言語 | 言語(日本語名) | languageHints コード |
スクリプト | メモ | |
|---|---|---|---|---|---|
| አማርኛ | アムハラ語 | am |
Ethi |
||
| Αρχαία ελληνικά | 古代ギリシャ語 | grc |
Grek |
||
| অসমীয়া | アッサム語 | as |
Beng |
||
| Azərbaycan | アゼルバイジャン語 | az |
Latn |
||
| Azərbaycan (qədim yazı) | アゼルバイジャン語 | az-Cyrl |
Cyrl |
旧正書法 | |
| Euskara | バスク語 | eu |
Latn |
||
| Bosanski | ボスニア語 | bs |
Latn |
||
| မြန်မာ | ビルマ語 | my |
Mymr |
||
| Cebuano | セブ語 | ceb |
Latn |
||
| ᏣᎳᎩ ᎦᏬᏂᎯᏍᏗ | チェロキー語 | chr |
Cher |
||
| dhivehi, dhivehi-bas | ディベヒ語 | dv |
Thaa |
||
| རྫོང་ཁ | ゾンカ語 | dz |
Tibt |
||
| Esperanto | エスペラント語 | eo |
Latn |
||
| Galego | ガリシア語 | gl |
Latn |
||
| ქართული | ジョージア語 | ka |
Geor |
||
| Kreyòl Ayisyen | クレオール語(ハイチ) | ht |
Latn |
||
| Gaeilge | アイルランド語 | ga |
Latn |
||
| Jawa | ジャワ語 | jv |
Latn |
||
| Қазақ | カザフ語 | kk |
Cyrl |
||
| Kirghiz | キルギス語 | ky |
Cyrl |
||
| Latine | ラテン語 | la |
Latn |
||
| Malti | マルタ語 | mt |
Latn |
||
| Монгол | モンゴル語 | mn |
Cyrl |
||
| ଓଡ଼ିଆ | オリヤ語 | or |
Orya |
||
| پښتو | パシュト語 | ps |
Arab |
||
| संस्कृतम् | サンスクリット語 | sa |
Deva |
||
| සිංහල | シンハラ語 | si |
Sinh |
||
| Swahili | スワヒリ語 | sw |
Latn |
||
| leššānā Suryāyā | シリア文字 | syr |
Syriac |
||
| བོད་སྐད་ | チベット語 | bo |
Tibt |
||
| ትግርኛ | ティグリニャ語 | ti |
Ethi |
||
| اردو | ウルドゥー語 | ur |
Arab |
||
| oʻzbekcha | ウズベク語 | uz |
Latn |
ラテン語 | |
| oʻzbekcha | ウズベク語 | uz-Cyrl |
Cyrl |
旧正書法 | |
| Cymraeg | ウェールズ語 | cy |
Latn |
||
| IsiZulu | ズールー語 | zu |
Latn |
マッピング言語
次の言語は、別の言語コードにマッピングされるか、一般的な文字認識ツールにマッピングされます。
| 言語 | 言語(日本語名) | languageHints コード |
スクリプト | メモ | |
|---|---|---|---|---|---|
| بهسا اچيه | アチェ語 | ace |
Latn |
ラテン文字モデル | |
| Lwo | アチョリ語 | ach |
Latn |
ラテン文字モデル | |
| Dangme | アダングメ語 | ada |
Latn |
ラテン文字モデル | |
| Akan | アカン語 | ak |
Latn |
ラテン文字モデル | |
| Anicinâbemowin | アルゴンキン語 | alg |
Latn |
ラテン文字モデル | |
| Mapudungu | アラウカニア語 / マプチェ語 | arn |
Latn |
ラテン文字モデル | |
| Asturianu | アストゥリアス語 | ast |
Latn |
ラテン文字モデル | |
| Dene | アサバスカ語 | ath |
Latn |
ラテン文字モデル | |
| Aymar aru | アイマラ語 | ay |
Latn |
ラテン文字モデル | |
| Bhāṣa Bali | バリ文字 | ban |
Latn |
ラテン文字モデル | |
| Bamanankan | バンバラ語 | bm |
Latn |
ラテン文字モデル | |
| Narrow Bantu | バントゥー語 | bnt |
Latn |
ラテン文字モデル | |
| башҡорт теле | バシキール語 | ba |
Cyrl |
キリル文字モデル | |
| Toba–Batak | バタク文字 | btk |
Latn |
ラテン文字モデル | |
| Chibemba | ベンバ語 | bem |
Latn |
ラテン文字モデル | |
| Bikol Naga | ビコール語 | bik |
Latn |
ラテン文字モデル | |
| Bichelamar | ビスラマ語 | bi |
Latn |
ラテン文字モデル | |
| Brezhoneg | ブルトン語 | br |
Latn |
ラテン文字モデル | |
| нохчийн мотт / noxçiyn mott | チェチェン語 | ce |
Cyrl |
キリル文字モデル | |
| 汉语 | 中国語(標準語、簡体) | zh-Hans |
Hans |
中国語モデル | |
| 漢語 | 中国語(標準語、繁体) | zh-Hant |
Hant |
中国語モデル | |
| 普通話 | 中国語(標準語、香港) | zh-Hant-HK |
Hant |
中国語モデル | |
| Chahta' | チョクトー語 | cho |
Latn |
ラテン文字モデル | |
| Чӑвашла | チュヴァシ語 | cv |
Cyrl |
キリル文字モデル | |
| Cree–Montagnais–Naskapi | クリー語 | cr |
Latn |
ラテン文字モデル | |
| Mvskoke | クリーク語 | mus |
Latn |
ラテン文字モデル | |
| qırımtatar tili, къырымтатар тили | クリミア タタール語 | crh |
Latn |
キリル文字モデル | |
| Dakhótiyapi, Dakȟótiyapi | ダコタ語 | dak |
Latn |
ラテン文字モデル | |
| Douala | ドゥアラ語 | dua |
Latn |
ラテン文字モデル | |
| Ikɔ Efik | エフィク語 | efi |
Latn |
ラテン文字モデル | |
| English (British) | 英語(英国) | en-GB |
Latn |
ラテン文字モデル | |
| Èʋegbe | エウェ語 | ee |
Latn |
ラテン文字モデル | |
| føroyskt mál | フェロー語 | fo |
Latn |
ラテン文字モデル | |
| Na Vosa Vakaviti | フィジー語 | fj |
Latn |
ラテン文字モデル | |
| fɔ̀ngbè | フォン語 | fon |
Latn |
ラテン文字モデル | |
| Français canadien | フランス語(カナダ) | fr-CA |
Latn |
ラテン文字モデル | |
| Fulani, Fulah, Peul | フラニ語 | ff |
Latn |
ラテン文字モデル | |
| Gã | ガ語 | gaa |
Latn |
ラテン文字モデル | |
| Luganda | ガンダ語 | lg |
Latn |
ラテン文字モデル | |
| Basa Gayo | ガヨ語 | gay |
Latn |
ラテン文字モデル | |
| Kiribati | キリバス語 | gil |
Latn |
ラテン文字モデル | |
| Gothic | ゴート文字 | got |
Latn |
ラテン文字モデル | |
| Guaraní | グアラニ語 | gn |
Latn |
ラテン文字モデル | |
| Harshen/Halshen Hausa هَرْشَن هَوْسَ | ハウサ語 | ha |
Latn |
ラテン文字モデル | |
| ʻŌlelo Hawaiʻi | ハワイ語 | haw |
Latn |
ラテン文字モデル | |
| Otjiherero | ヘレロ語 | hz |
Latn |
ラテン文字モデル | |
| Ilonggo | ヒリガイノン語 | hil |
Latn |
ラテン文字モデル | |
| Jaku Iban | イバン語 | iba |
Latn |
ラテン文字モデル | |
| Asụsụ Igbo | イボ語 | ig |
Latn |
ラテン文字モデル | |
| Ilokano | イロカノ語 | ilo |
Latn |
ラテン文字モデル | |
| Taqbaylit | カビル語 | kab |
Latn |
ラテン文字モデル | |
| Jingpho | カチン | kac |
Latn |
ラテン文字モデル | |
| Kalaallisut | カラーリット語 | kl |
Latn |
ラテン文字モデル | |
| Kikamba | カンバ語 | kam |
Latn |
ラテン文字モデル | |
| Kanuri | カヌリ語 | kr |
Latn |
ラテン文字モデル | |
| Qaraqalpaq tili, Қарақалпақ тили, قاراقالپاق تىلى | カラカルパク語 | kaa |
Cyrl/Latn |
キリル文字モデル | |
| Ka Ktien Khasi | カーシ語 | kha |
Latn |
ラテン文字モデル | |
| Gĩkũyũ | キクユ語 | ki |
Latn |
ラテン文字モデル | |
| Kinyarwanda | キニヤルワンダ語 | rw |
Latn |
ラテン文字モデル | |
| коми кыв | コミ語 | kv |
Cyrl |
キリル文字モデル | |
| Kikongo | コンゴ語 | kg |
Latn |
ラテン文字モデル | |
| Kosraean | コスラエ語 | kos |
Latn |
ラテン文字モデル | |
| Oshikwanyama | クワニャマ語 | kj |
Latn |
ラテン文字モデル | |
| Ngala | リンガラ語 | ln |
Latn |
ラテン文字モデル | |
| Plattdütsch, Plattdeutsch, Nedersaksisch | 低地ドイツ語 | nds |
Latn |
ラテン文字モデル | |
| siLozi | ロジ語 | loz |
Latn |
ラテン文字モデル | |
| Kiluba | ルバカタンガ語 | lu |
Latn |
ラテン文字モデル | |
| Dholuo | ルオ語 | luo |
Latn |
ラテン文字モデル | |
| Madhura, Basa Mathura, بَهاسَ مَدورا | マドゥラ語 | mad |
Latn |
ラテン文字モデル | |
| Malagasy | マラガシ語 | mg |
Latn |
ラテン文字モデル | |
| Mandinka, لغة مندنكا | マンディンゴ語 | man |
Latn |
ラテン文字モデル | |
| Gaelg, Gailck | マン島語 | gv |
Latn |
ラテン文字モデル | |
| Te reo Māori | マオリ語 | mi |
Latn |
ラテン文字モデル | |
| Ebon | マーシャル語 | mh |
Latn |
ラテン文字モデル | |
| Mɛnde yia | メンデ語 | men |
Latn |
ラテン文字モデル | |
| Middle English | 中英語 | enm |
Latn |
ラテン文字モデル | |
| Mittelhochdeutsch | 中高ドイツ語 | gmh |
Latn |
ラテン文字モデル | |
| Baso Minangkabau, باسو مينڠكاباو | ミナンカバウ語 | min |
Latn |
ラテン文字モデル | |
| Kanienʼkéha | モホーク語 | moh |
Latn |
ラテン文字モデル | |
| Nkundu | モンゴ語 | lol |
Latn |
ラテン文字モデル | |
| Nāhuatl | ナワトル語 | nah |
Latn |
ラテン文字モデル | |
| Diné bizaad | ナヴァホ語 | nv |
Latn |
ラテン文字モデル | |
| Ndonga | ンドンガ語 | ng |
Latn |
ラテン文字モデル | |
| ko e vagahau Niuē | ニウエ語 | niu |
Latn |
ラテン文字モデル | |
| Zimbabwe Ndebele | 北ンデベレ語 | nd |
Latn |
ラテン文字モデル | |
| Sesotho sa Leboa | 北ソト語 | nso |
Latn |
ラテン文字モデル | |
| Chichewa, Chinyanja | ニャンジャ語 | ny |
Latn |
ラテン文字モデル | |
| Runyankore | ニャンコレ語 | nyn |
Latn |
ラテン文字モデル | |
| Chitonga | トンガ語(ニアサ) | tog |
Latn |
ラテン文字モデル | |
| Appolo | ンジマ語 | nzi |
Latn |
ラテン文字モデル | |
| Occitan, lenga d'òc, provençal | オック語 | oc |
Latn |
ラテン文字モデル | |
| Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | オジブワ語 | oj |
Latn |
ラテン文字モデル | |
| Ænglisc, Englisc, Anglisc | 古英語 | ang |
Latn |
ラテン文字モデル | |
| Franceis, François, Romanz | 古フランス語 | fro |
Latn |
ラテン文字モデル | |
| Diutisk, Althochdeutsch | 古高ドイツ語 | goh |
Latn |
ラテン文字モデル | |
| Dǫnsk tunga | 古ノルド語 | non |
Latn |
ラテン文字モデル | |
| Occitan ancian | 古プロヴァンス語 | pro |
Latn |
ラテン文字モデル | |
| ирон ӕвзаг | オセット語 | os |
Cyrl |
キリル文字モデル | |
| Kapampangan | パンパンガ | pam |
Latn |
ラテン文字モデル | |
| Salitan Pangasinan | パンガシナン | pag |
Latn |
ラテン文字モデル | |
| Papiamentu | パピアメント語 | pap |
Latn |
ラテン文字モデル | |
| Português (Portugal) | ポルトガル語(ヨーロッパ) | pt-PT |
Latn |
ラテン文字モデル | |
| Kechua / Runa Simi | ケチュア語 | qu |
Latn |
ラテン文字モデル | |
| Rumantsch | ロマンシュ語 | rm |
Latn |
ラテン文字モデル | |
| Romani čhib | ロマ語 | rom |
Latn |
ラテン文字モデル | |
| Ikirundi | ルンディ語 | rn |
Latn |
ラテン文字モデル | |
| Sakha | サカ語 | sah |
Cyrl |
キリル文字モデル | |
| Gagana faʻa Sāmoa | サモア語 | sm |
Latn |
ラテン文字モデル | |
| yângâ tî sängö | サンゴ語 | sg |
Latn |
ラテン文字モデル | |
| (Braid) Scots, Lallans, Doric | スコットランド語 | sco |
Latn |
ラテン文字モデル | |
| Gàidhlig | スコットランド ゲール語 | gd |
Latn |
ラテン文字モデル | |
| chiShona | ショナ語 | sn |
Latn |
ラテン文字モデル | |
| Songhay | ソンガイ語 | son |
Latn |
ラテン文字モデル | |
| Sesotho | 南部ソト語 | st |
Latn |
ラテン文字モデル | |
| Español (Latinoamérica) | スペイン語(ラテンアメリカ) | es-419 |
Latn |
ラテン文字モデル | |
| ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | スンダ文字 | su |
Latn |
ラテン文字モデル | |
| siSwati | スワート語 | ss |
Latn |
ラテン文字モデル | |
| Reo Tahiti | タヒチ語 | ty |
Latn |
ラテン文字モデル | |
| тоҷикӣ | タジク語 | tg |
Cyrl |
キリル文字モデル | |
| татар теле | タタール語 | tt |
Cyrl/Latn |
キリル文字モデル | |
| KʌThemnɛ | テムネ語 | tem |
Latn |
ラテン文字モデル | |
| lea faka-Tonga | トンガ語 | to |
Latn |
ラテン文字モデル | |
| Xitsonga | ツォンガ語 | ts |
Latn |
ラテン文字モデル | |
| Setswana | ツワナ語 | tn |
Latn |
ラテン文字モデル | |
| Türkmençe | トルクメン語 | tk |
Latn |
キリル文字モデル | |
| удмурт кыл | ウドムルト語 | udm |
Cyrl |
キリル文字モデル | |
| Tshivenḓa | ヴェンダ語 | ve |
Latn |
ラテン文字モデル | |
| Vod | ヴォート語 | vot |
Cyrl/Latn |
キリル文字モデル | |
| Frysk | 西フリジア語 | fy |
Latn |
ラテン文字モデル | |
| Wolof | ウォロフ語 | wo |
Latn |
ラテン文字モデル | |
| isiXhosa | コーサ語 | xh |
Latn |
ラテン文字モデル | |
| Èdè Yorùbá | ヨルバ語 | yo |
Latn |
ラテン文字モデル | |
| Diidxazá | サポテカ語 | zap |
Latn |
ラテン文字モデル |
手書き文字のスクリプト
手書き入力認識でサポートされているスクリプトは次のとおりです。各スクリプトを使用する言語については、上の言語表を参照してください。
| スクリプト | 名前 | サポート レベル |
|---|---|---|
Beng |
ベンガル語 | 試験運用版 |
Cyrl |
キリル文字 | 試験運用版 |
Deva |
デバナーガリ文字 | 試験運用版 |
Grek |
ギリシャ語 | 試験運用版 |
Hani |
中国語 | 試験運用版 |
Jpan |
日本語 | サポート対象 |
Kore |
韓国語 | サポート対象 |
Latn |
ラテン語 | サポート対象 |
vi |
ベトナム語 | 試験運用版 |