Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Document AI.
- Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
- Batas sistem adalah nilai tetap yang tidak dapat diubah.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud sendiri.
Sistem Kuota Cloud melakukan hal berikut:
- Memantau pemakaian Google Cloud produk dan layanan
- Membatasi pemakaian resource tersebut
- Menyediakan cara untuk meminta perubahan pada nilai kuota dan mengotomatiskan penyesuaian kuota
Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource melebihi kuota yang diizinkan, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia dalam project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.
Untuk mengetahui informasi selengkapnya, lihat Ringkasan Kuota Cloud.
Untuk meningkatkan kapasitas yang tersedia untuk project Anda, baca tentang permintaan reservasi kapasitas.
Tingkat Layanan
Document AI mendukung dua tingkat layanan dan kuota terkait untuk permintaan pemrosesan online ke versi pemroses yang didukung AI Generatif: tingkat yang disediakan dan tingkat upaya terbaik.
Kuota tingkat yang disediakan memberikan 120 halaman per menit untuk versi prosesor dasar, seperti ekstraktor kustom v1.4 dan v1.5, serta 30 halaman per menit untuk versi prosesor dasar seperti ekstraktor kustom v1.5 Pro.
Kuota tingkat upaya terbaik menyediakan 120 untuk versi prosesor dasar seperti pengekstrak kustom v1.4 dan v1.5, 60 untuk versi prosesor Pro seperti pengekstrak kustom v1.5 Pro, dan hanya digunakan setelah kuota yang disediakan habis. Hal ini berlaku untuk
kuota BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(metrik best_effort_online_process_document_pages_us), dan
BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(metrik best_effort_online_process_document_pages_eu) di konsol.
| Catatan | Pengekstrak kustom v1.4 (berdasarkan Gemini 2.0 Flash) | Pengekstrak kustom v1.5 (berdasarkan Gemini 2.5 Flash) | Pengekstrak kustom v1.5 Pro (berdasarkan Gemini 2.5 Pro) |
|---|---|---|---|
| Disediakan | 120 | 120 | 30 |
| Upaya terbaik | 120 | 120 | 60 |
| Disediakan di tingkat organisasi | 240 | 240 | 60 |
Jika Anda memerlukan lebih dari yang tercantum dalam kuota upaya terbaik, Anda dapat mengajukan permintaan penambahan kuota (QIR) dengan menghubungi tim Penjualan.
Untuk mengamankan kapasitas yang lebih tersedia selama traffic bervolume tinggi, baca bagian tentang cara membuat permintaan reservasi kapasitas.
Tidak ada perjanjian tingkat layanan untuk tingkat upaya terbaik.
Daftar kuota
Kuota berikut berlaku untuk Document AI. Kuota ini berlaku untuk setiap project konsol dan digunakan bersama oleh semua aplikasi dan alamat IP yang menggunakan project tersebut. Google Cloud
Jika ingin memproses lebih banyak permintaan, kirimkan permintaan kuota Document AI untuk project Anda di konsol Google Cloud .
Berikan informasi tentang kebutuhan dan kasus penggunaan spesifik Anda dalam permintaan.
| Kuota Permintaan | Nilai Default | Catatan |
|---|---|---|
| Permintaan per menit | 1.800 per pengguna | Lihat kuota di konsol Google Cloud |
| Permintaan proses online per menit (Amerika Serikat) | 120 per project per jenis prosesor | Lihat kuota di konsol Google Cloud |
| Permintaan proses online per menit (Uni Eropa) | 120 per project per jenis prosesor | Lihat kuota di konsol Google Cloud |
| Jumlah halaman dokumen pemrosesan online (Amerika Serikat) per menit per jenis pemroses dan versi model (Khusus Ekstraktor Kustom v1.4 dengan Gemini 2.0 Flash) | 120 halaman per menit* | Lihat kuota di konsol Google Cloud |
| Jumlah halaman dokumen pemrosesan online (Uni Eropa) per menit per jenis pemroses dan versi model (Khusus Pengekstrak Kustom v1.4 dengan Gemini 2.0 Flash) | 120 halaman per menit* | Lihat kuota di konsol Google Cloud |
| Jumlah halaman dokumen pemrosesan online (Amerika Serikat) per menit per jenis pemroses dan versi model (khusus Custom Extractor v1.5 dengan Gemini 2.5 Flash) | 120 halaman per menit* | Lihat kuota di konsol Google Cloud |
| Jumlah halaman dokumen pemrosesan online (Uni Eropa) per menit per jenis pemroses dan versi model (Khusus Ekstraktor Kustom v1.5 dengan Gemini 2.5 Flash) | 120 halaman per menit* | Lihat kuota di konsol Google Cloud |
| Jumlah halaman dokumen proses upaya terbaik online (Amerika Serikat) per menit per jenis pemroses dan versi model | 120 halaman per menit‡ | Lihat kuota di konsol Google Cloud |
| Jumlah halaman dokumen proses terbaik online (Uni Eropa) per menit per jenis pemroses dan versi model | 120 halaman per menit‡ | Lihat kuota di konsol Google Cloud |
| Jumlah halaman dokumen proses upaya terbaik online (satu region) per menit per jenis pemroses dan versi model | 120 halaman per menit‡ | Lihat kuota di konsol Google Cloud |
| Permintaan proses online per menit (satu region) | 6 per project per jenis prosesor | Lihat kuota di konsol Google Cloud |
| Permintaan batch processing serentak per project dan region (Amerika Serikat) | 5 per project | Lihat kuota di konsol Google Cloud |
| Permintaan proses batch serentak per project dan wilayah (Uni Eropa) | 5 per project | Lihat kuota di konsol Google Cloud |
| Permintaan batch processing serentak per pemroses (satu region) | 5 per project | Lihat kuota di konsol Google Cloud |
| Permintaan pelatihan versi pemroses serentak (Amerika Serikat) | 1 per project | Lihat kuota di konsol Google Cloud |
| Permintaan pelatihan versi pemroses serentak (Uni Eropa) | 1 per project | Lihat kuota di konsol Google Cloud |
| Permintaan pelatihan versi pemroses serentak (satu region) | 1 per project† | Lihat kuota di konsol Google Cloud |
| Versi pemroses kustom yang di-deploy (Amerika Serikat) | 5 per project | Lihat kuota di konsol Google Cloud |
| Versi prosesor kustom yang di-deploy (Uni Eropa) | 5 per project | Lihat kuota di konsol Google Cloud |
| Versi pemroses kustom yang di-deploy (satu region) | 5 per project | Lihat kuota di konsol Google Cloud |
| Versi pemroses generatif yang di-deploy (Amerika Serikat) | 100 per project per pemroses ekstraksi kustom | Lihat kuota di konsol Google Cloud |
| Versi pemroses generatif yang di-deploy (Uni Eropa) | 100 per project per pemroses ekstraksi kustom | Lihat kuota di konsol Google Cloud |
| Versi pemroses generatif yang di-deploy (satu region) | 100 per project per pemroses ekstraksi kustom | Lihat kuota di konsol Google Cloud |
| Permintaan dokumen impor serentak (Amerika Serikat) | 3 per project | Lihat kuota di konsol Google Cloud |
| Permintaan dokumen impor serentak (Uni Eropa) | 3 per project | Lihat kuota di konsol Google Cloud |
| Permintaan dokumen impor serentak (satu wilayah) | 3 per project | Lihat kuota di konsol Google Cloud |
| Permintaan dokumen ekspor serentak (Amerika Serikat) | 1 per project | Lihat kuota di konsol Google Cloud |
| Permintaan dokumen ekspor serentak (Uni Eropa) | 1 per project | Lihat kuota di konsol Google Cloud |
| Permintaan ekspor dokumen serentak (satu wilayah) | 1 per project | Lihat kuota di konsol Google Cloud |
* Permintaan penyesuaian kuota belum didukung untuk versi ini.
† Didukung di australia-southeast1 dengan permintaan penyesuaian kuota.
‡ Bervariasi bergantung pada versi Gemini, lihat tingkat layanan. Tinjau cara membuat permintaan reservasi kapasitas.
Jika project Anda memerlukan kapasitas yang lebih besar, baca Reservasi kapasitas.