Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Document AI.
- Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
- Batas sistem adalah nilai tetap yang tidak dapat diubah.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud sendiri.
Sistem Kuota Cloud melakukan hal berikut:
- Memantau pemakaian Google Cloud produk dan layanan
- Membatasi pemakaian resource tersebut
- Menyediakan cara untuk meminta perubahan pada nilai kuota dan mengotomatiskan penyesuaian kuota
Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource melebihi kuota yang diizinkan, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia dalam project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.
Untuk mengetahui informasi selengkapnya, lihat Ringkasan Kuota Cloud.
Untuk meningkatkan kapasitas yang tersedia untuk project Anda, baca tentang permintaan reservasi kapasitas.
Tingkat layanan online
Document AI mendukung dua tingkat layanan dan kuota terkait untuk permintaan proses online ke versi pemroses yang didukung AI Generatif: tingkat yang disediakan dan tingkat upaya terbaik.
Kuota tingkat yang disediakan memberikan 120 halaman per menit untuk versi pemroses dasar, seperti pengekstrak kustom v1.4 dan v1.5, serta 30 halaman per menit untuk versi pemroses dasar seperti pengekstrak kustom v1.5 Pro.
Kuota tingkat upaya terbaik memberikan 120 untuk versi pemroses dasar seperti pengekstrak kustom v1.4 dan v1.5, 60 untuk versi pemroses Pro seperti pengekstrak kustom v1.5 Pro, dan hanya digunakan setelah kuota yang disediakan habis. Hal ini berlaku untuk kuota BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (metrik best_effort_online_process_document_pages_us), dan BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (metrik best_effort_online_process_document_pages_eu) di konsol.
| Catatan | Pemroses berdasarkan Gemini 2.0 Flash | Pemroses berdasarkan Gemini 2.5 Flash | Pemroses berdasarkan Gemini 2.5 Pro |
|---|---|---|---|
| Pemroses seperti: | Pengekstrak kustom v1.4 | Pengekstrak kustom v1.5 | Semua versi Pro seperti Pengekstrak kustom v1.5 Pro dan v1.6 Pro |
| Disediakan | 120 | 120 | 30 |
| Upaya terbaik | 120 | 120 | 60 |
| Upaya terbaik dengan permintaan peningkatan kuota | 240 | 240 | 120 |
| Disediakan tingkat organisasi | 240 | 240 | 60 |
| Kapasitas yang dicadangkan, dibeli | Tersedia | Tersedia | Tidak tersedia |
Jika Anda memerlukan lebih dari kuota upaya terbaik yang tercantum, Anda dapat membuat permintaan peningkatan kuota (QIR) dengan menghubungi tim Penjualan.
Untuk mengamankan lebih banyak kapasitas yang tersedia selama traffic volume tinggi, baca bagian tentang cara membuat permintaan reservasi kapasitas.
Tidak ada perjanjian tingkat layanan untuk tingkat upaya terbaik.
Daftar kuota
Kuota berikut berlaku untuk Document AI. Kuota ini berlaku untuk setiap Google Cloud project konsol dan dibagikan ke semua aplikasi dan alamat IP yang menggunakan project tersebut.
Jika ingin memproses lebih banyak permintaan, kirimkan permintaan kuota Document AI untuk project Anda di Google Cloud konsol.
Berikan informasi tentang kebutuhan dan kasus penggunaan spesifik Anda dalam permintaan.
| Kuota Permintaan | Nilai Default | Catatan |
|---|---|---|
| Permintaan per menit | 1.800 per pengguna1 | Lihat kuota di Google Cloud konsol |
| Permintaan proses online per menit (AS) | 120 per project per jenis pemroses | Lihat kuota di Google Cloud konsol |
| Permintaan proses online per menit (UE) | 120 per project per jenis pemroses | Lihat kuota di Google Cloud konsol |
| Jumlah halaman dokumen proses online (AS) per menit per jenis pemroses dan versi model (Pengekstrak Kustom v1.4 dengan Gemini 2.0 Flash saja) | 120 halaman per menit2 | Lihat kuota di Google Cloud konsol |
| Jumlah halaman dokumen proses online (UE) per menit per jenis pemroses dan versi model (Pengekstrak Kustom v1.4 dengan Gemini 2.0 Flash saja) | 120 halaman per menit2 | Lihat kuota di Google Cloud konsol |
| Jumlah halaman dokumen proses online (AS) per menit per jenis pemroses dan versi model (Pengekstrak Kustom v1.5 dengan Gemini 2.5 Flash saja) | 120 halaman per menit2 | Lihat kuota di Google Cloud konsol |
| Jumlah halaman dokumen proses online (UE) per menit per jenis pemroses dan versi model (Pengekstrak Kustom v1.5 dengan Gemini 2.5 Flash saja) | 120 halaman per menit2 | Lihat kuota di Google Cloud konsol |
| Jumlah halaman dokumen proses upaya terbaik online (AS) per menit per jenis pemroses dan versi model | 120 halaman per menit4 | Lihat kuota di Google Cloud konsol |
| Jumlah halaman dokumen proses upaya terbaik online (UE) per menit per jenis pemroses dan versi model | 120 halaman per menit4 | Lihat kuota di Google Cloud konsol |
| Jumlah halaman dokumen proses upaya terbaik online (satu region) per menit per jenis pemroses dan versi model | 120 halaman per menit4 | Lihat kuota di Google Cloud konsol |
| Permintaan proses online per menit (satu region) | 6 per project per jenis pemroses | Lihat kuota di Google Cloud konsol |
| Permintaan proses batch serentak per project dan region (AS) | 5 per project | Lihat kuota di Google Cloud konsol |
| Permintaan proses batch serentak per project dan region (UE) | 5 per project | Lihat kuota di Google Cloud konsol |
| Permintaan proses batch serentak per pemroses (satu region) | 5 per project | Lihat kuota di Google Cloud konsol |
| Permintaan pelatihan versi pemroses serentak (AS) | 1 per project | Lihat kuota di Google Cloud konsol |
| Permintaan pelatihan versi pemroses serentak (UE) | 1 per project | Lihat kuota di Google Cloud konsol |
| Permintaan pelatihan versi pemroses serentak (satu region) | 1 per project3 | Lihat kuota di Google Cloud konsol |
| Versi pemroses kustom yang di-deploy (AS) | 5 per project | Lihat kuota di Google Cloud konsol |
| Versi pemroses kustom yang di-deploy (UE) | 5 per project | Lihat kuota di Google Cloud konsol |
| Versi pemroses kustom yang di-deploy (satu region) | 5 per project | Lihat kuota di Google Cloud konsol |
| Versi pemroses generatif yang di-deploy (AS) | 100 per project per pemroses ekstraksi kustom | Lihat kuota di Google Cloud konsol |
| Versi pemroses generatif yang di-deploy (UE) | 100 per project per pemroses ekstraksi kustom | Lihat kuota di Google Cloud konsol |
| Versi pemroses generatif yang di-deploy (satu region) | 100 per project per pemroses ekstraksi kustom | Lihat kuota di Google Cloud konsol |
| Permintaan impor dokumen serentak (AS) | 3 per project | Lihat kuota di Google Cloud konsol |
| Permintaan impor dokumen serentak (UE) | 3 per project | Lihat kuota di Google Cloud konsol |
| Permintaan impor dokumen serentak (satu region) | 3 per project | Lihat kuota di Google Cloud konsol |
| Permintaan ekspor dokumen serentak (AS) | 1 per project | Lihat kuota di Google Cloud konsol |
| Permintaan ekspor dokumen serentak (UE) | 1 per project | Lihat kuota di Google Cloud konsol |
| Permintaan ekspor dokumen serentak (satu region) | 1 per project | Lihat kuota di Google Cloud konsol |
- Batch kuota permintaan per menit adalah untuk jumlah dokumen yang diminta per menit, bukan jumlah halaman atau panggilan API `batchProcess`.
- Permintaan penyesuaian kuota belum didukung untuk versi ini.
- Didukung di
australia-southeast1dengan permintaan penyesuaian kuota. - Bervariasi bergantung pada versi Gemini, lihat tingkat layanan. Tinjau cara membuat permintaan reservasi kapasitas.
Jika project Anda memerlukan lebih banyak kapasitas, baca tentang Reservasi kapasitas.