制限
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
このドキュメントでは、Document AI に適用されるシステムの上限について説明します。割り当てとは異なり、システムの上限は変更できません。
コンテンツの上限
次のコンテンツの上限は、すべての Document AI プロセッサに適用されます。
プロセッサの上限
上限は現在のリストで定義されています。
分類プロセッサ
デジタル化プロセッサ
事前トレーニング済みプロセッサ
Document AI の制限事項
Document AI には現在、次の制限があります。
| 条件 |
安定版リリース 2023 年 7 月 |
|---|
| データセット |
- ドキュメントの合計数: 最大 30,000
- ページの合計数: 最大 250,000
|
| 処理時間 |
バッチジョブは非同期で処理され、
リアルタイム アプリケーション向けに設計されていません。ほとんどのジョブは、実行の開始後 12 ~ 24 時間
以内に完了します(キュー時間は含まれません)。24
時間が経過すると、未完了のジョブはキャンセルされます。完了したリクエストに対してのみ課金されます。
|
| ドキュメントのインポート |
- インポートあたりのドキュメント数: 最大 5,000
- ドキュメントあたりのページ数: 最大 200
|
| カスタム ドキュメント エクストラクタ(CDE)をトレーニングする際の上限 |
モデルベースのトレーニング (GA)
- トレーニング データセットの上限: 25,000 ドキュメント、100,000 ページ
- トレーニング データセットの最小値: 10 個のドキュメントごとに少なくとも 1 つのラベルに各ラベルが存在する必要があります
- テスト データセットの上限: 2,000 ドキュメント、8,000 ページ
- テスト データセットの最小値: 少なくとも 10 個のドキュメントにすべてのラベルが存在する必要があります
- ドキュメントあたりのページ数: 最大 200
テンプレートベースのトレーニング(GA)
- トレーニング データセットの上限: 300 ドキュメント、300 ページ
- トレーニング データセットの最小値: 少なくとも 3 個のドキュメントにすべてのラベルが存在する必要があります
- テスト データセットの上限: 2,000 ドキュメント、8,000 ページ
- テスト データセットの最小値: 少なくとも 3 個のドキュメントにすべてのラベルが存在する必要があります
- ドキュメントあたりのページ数: 最大 20
|
| カスタム ドキュメント分類器(CDC)またはカスタム ドキュメント スプリッター(CDS)をトレーニングする際の上限 |
- トレーニング データセットの上限: 30,000 ドキュメント、100,000 ページ
- トレーニング データセットの最小値: 少なくとも 10 個のドキュメントにすべてのラベルが存在する必要があります
- テスト データセットの上限: 2,000 ドキュメント、8,000 ページ
- テスト データセットの最小値: 少なくとも 2 個のドキュメントにすべてのラベルが存在する必要があります
- ドキュメントあたりのページ数: 最大 200
|
| ラベル付け |
- まず、ドキュメント ラベルが定義された最小トレーニングしきい値と評価しきい値を満たしていることを確認します。
- レイアウトが異なるドキュメントのモデルのパフォーマンスの評価を開始するには、少なくとも 100 個のドキュメントにラベルを付けます。具体的には、トレーニングで 50 個のドキュメント、評価で 50 個のドキュメントに各ラベルが存在することを確認します。
- 許容されるラベル(フィールド)の最大数: 150
- ラベルサイズの制限(文字数): 長いアイテムは十分にサポートされていませんが、明示的な制限はありません。ドキュメントを 800 ~ 1,000 トークンのチャンクに分割し、チャンク間で 100 ~ 200 トークンを重複させます。(重複する領域よりも長いアイテムでは、品質の問題が発生する可能性があります)。
- ドキュメント内のラベルの出現回数: 制限なし
|
| 地理的な対象範囲 |
- 一般的にサポートされているリージョン: 米国、EU(マルチリージョン)
- アクセスが制限されているリージョン: ドイツ、シンガポール、英国、カナダ、インド、オーストラリア
|
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2026-04-10 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2026-04-10 UTC。"],[],[]]