このドキュメントでは、 Document AI に適用される割り当てと上限について説明します。
- 割り当てにはデフォルト値がありますが、通常は 調整をリクエストできます。
- システムの上限は固定値で、変更できません。
Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud のプロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストし、割り当ての調整を自動化する手段を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
詳細については、 Cloud Quotas の概要をご覧ください。
プロジェクトで使用可能な容量を増やすには、容量予約リクエストをご覧ください。
オンライン サービス層
Document AI は、生成 AI を搭載したプロセッサ バージョンへのオンライン処理リクエストに対して、プロビジョニング済みとベスト エフォートの 2 つのサービス層と関連する割り当てをサポートしています。
プロビジョニング済み層の割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンで 1 分あたり 120 ページ、カスタム エクストラクタ v1.5 Pro などのベース プロセッサ バージョンで 1 分あたり 30 ページが提供されます。
ベスト エフォート層の割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンで 120、カスタム エクストラクタ
v1.5 Pro などの Pro プロセッサ バージョンで 60 が提供され、プロビジョニング済み割り当てが使い果たされた場合にのみ使用されます。これは、コンソールの割り当て
BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS(指標
best_effort_online_process_document_pages_us)と
BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU(指標
best_effort_online_process_document_pages_eu)に適用されます。
| メモ | Gemini 2.0 Flash に基づくプロセッサ | Gemini 2.5 Flash に基づくプロセッサ | Gemini 2.5 Pro に基づくプロセッサ |
|---|---|---|---|
| 次のようなプロセッサ: | カスタム エクストラクタ v1.4 | カスタム エクストラクタ v1.5 | カスタム エクストラクタ v1.5 Pro や v1.6 Pro などのすべての Pro バージョン |
| プロビジョニング済み | 120 | 120 | 30 |
| ベスト エフォート | 120 | 120 | 60 |
| 割り当て増加リクエストによるベスト エフォート | 240 | 240 | 120 |
| 組織レベルでプロビジョニング済み | 240 | 240 | 60 |
| 購入した予約容量 | 利用可能 | 利用可能 | 利用不可 |
ベスト エフォートの割り当てを超える必要がある場合は、営業チームにお問い合わせのうえ、割り当て 増加リクエスト(QIR)を行ってください。
トラフィックの多い時間帯に利用可能な容量を増やすには、容量予約リクエストを行う方法のセクションをご覧ください。
ベスト エフォート層にはサービスレベル契約はありません。
割り当てリスト
以下の割り当てが Document AI に適用されます。 この上限値は、各 Google Cloud コンソール プロジェクトに適用され、そのプロジェクトを使用するすべてのアプリケーションと IP アドレスで 共有されます。
より多くのリクエストを処理する場合は、コンソールでプロジェクトの Document AI 割り当て リクエストを送信してください。Google Cloud
リクエストで、具体的なニーズとユースケースに関する情報を提供してください。
| リクエストの割り当て | デフォルト値 | メモ |
|---|---|---|
| 1 分あたりのリクエスト数 | ユーザーあたり 1,8001 | コンソールで割り当てを表示する Google Cloud |
| 1 分あたりのオンライン処理リクエスト数(米国) | プロセッサ タイプごとに 1 プロジェクトあたり 120 | コンソールで割り当てを表示する Google Cloud |
| 1 分あたりのオンライン処理リクエスト数(EU) | プロセッサ タイプごとに 1 プロジェクトあたり 120 | コンソールで割り当てを表示する Google Cloud |
| プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(米国)(Gemini 2.0 Flash を使用したカスタム エクストラクタ v1.4 のみ) | 1 分あたり 120 ページ2 | コンソールで割り当てを表示する Google Cloud |
| プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(EU)(Gemini 2.0 Flash を使用したカスタム エクストラクタ v1.4 のみ) | 1 分あたり 120 ページ2 | コンソールで割り当てを表示する Google Cloud |
| プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(米国)(Gemini 2.5 Flash を使用したカスタム エクストラクタ v1.5 のみ) | 1 分あたり 120 ページ2 | コンソールで割り当てを表示する Google Cloud |
| プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(EU)(Gemini 2.5 Flash を使用したカスタム エクストラクタ v1.5 のみ) | 1 分あたり 120 ページ2 | コンソールで割り当てを表示する Google Cloud |
| プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン ベスト エフォート処理ドキュメント ページ数(米国) | 1 分あたり 120 ページ4 | コンソールで割り当てを表示する Google Cloud |
| プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン ベスト エフォート処理ドキュメント ページ数(EU) | 1 分あたり 120 ページ4 | コンソールで割り当てを表示する Google Cloud |
| プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン ベスト エフォート処理ドキュメント ページ数(単一リージョン) | 1 分あたり 120 ページ4 | コンソールで割り当てを表示する Google Cloud |
| 1 分あたりのオンライン処理リクエスト数(単一リージョン) | プロセッサ タイプごとに 1 プロジェクトあたり 6 | コンソールで割り当てを表示する Google Cloud |
| プロジェクトとリージョンごとの同時実行バッチ処理リクエスト数(米国) | 1 プロジェクトあたり 5 | コンソールで割り当てを表示する Google Cloud |
| プロジェクトとリージョンごとの同時実行バッチ処理リクエスト数(EU) | 1 プロジェクトあたり 5 | コンソールで割り当てを表示する Google Cloud |
| プロセッサごとの同時実行バッチ処理リクエスト数(単一リージョン) | 1 プロジェクトあたり 5 | コンソールで割り当てを表示する Google Cloud |
| 同時実行プロセッサ バージョン トレーニング リクエスト数(米国) | 1 プロジェクトあたり 1 | コンソールで割り当てを表示する Google Cloud |
| 同時実行プロセッサ バージョン トレーニング リクエスト数(EU) | 1 プロジェクトあたり 1 | コンソールで割り当てを表示する Google Cloud |
| 同時実行プロセッサ バージョン トレーニング リクエスト数(単一リージョン) | 1 プロジェクトあたり 13 | コンソールで割り当てを表示する Google Cloud |
| デプロイされたカスタム プロセッサ バージョン(米国) | 1 プロジェクトあたり 5 | コンソールで割り当てを表示する Google Cloud |
| デプロイされたカスタム プロセッサ バージョン(EU) | 1 プロジェクトあたり 5 | コンソールで割り当てを表示する Google Cloud |
| デプロイされたカスタム プロセッサ バージョン(単一リージョン) | 1 プロジェクトあたり 5 | コンソールで割り当てを表示する Google Cloud |
| デプロイされた生成プロセッサ バージョン(米国) | カスタム抽出プロセッサごとに 1 プロジェクトあたり 100 | コンソールで割り当てを表示する Google Cloud |
| デプロイされた生成プロセッサ バージョン(EU) | カスタム抽出プロセッサごとに 1 プロジェクトあたり 100 | コンソールで割り当てを表示する Google Cloud |
| デプロイされた生成プロセッサ バージョン(単一リージョン) | カスタム抽出プロセッサごとに 1 プロジェクトあたり 100 | コンソールで割り当てを表示する Google Cloud |
| 同時実行ドキュメント インポート リクエスト数(米国) | 1 プロジェクトあたり 3 | コンソールで割り当てを表示する Google Cloud |
| 同時実行ドキュメント インポート リクエスト数(EU) | 1 プロジェクトあたり 3 | コンソールで割り当てを表示する Google Cloud |
| 同時実行ドキュメント インポート リクエスト数(単一リージョン) | 1 プロジェクトあたり 3 | コンソールで割り当てを表示する Google Cloud |
| 同時実行ドキュメント エクスポート リクエスト数(米国) | 1 プロジェクトあたり 1 | コンソールで割り当てを表示する Google Cloud |
| 同時実行ドキュメント エクスポート リクエスト数(EU) | 1 プロジェクトあたり 1 | コンソールで割り当てを表示する Google Cloud |
| 同時実行ドキュメント エクスポート リクエスト数(単一リージョン) | 1 プロジェクトあたり 1 | コンソールで割り当てを表示する Google Cloud |
- 1 分あたりのリクエスト数の割り当てバッチは、1 分あたりにリクエストされるドキュメントの数であり、ページ数や `batchProcess` API 呼び出しの数ではありません。
- このバージョンでは、割り当て調整リクエストはまだサポートされていません。
australia-southeast1で、割り当て調整リクエストでサポートされています。- Gemini のバージョンによって異なります。サービス層をご覧ください。容量予約リクエストを行う方法を確認してください。
プロジェクトでより多くの容量が必要な場合は、容量 予約をご覧ください。