Kuota

Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Document AI.

  • Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
  • Batas sistem adalah nilai tetap yang tidak dapat diubah.

Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud sendiri.

Sistem Kuota Cloud melakukan hal berikut:

Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource melebihi kuota yang diizinkan, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.

Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia dalam project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Kuota Cloud.

Untuk meningkatkan kapasitas yang tersedia untuk project Anda, baca tentang permintaan reservasi kapasitas.

Tingkat layanan online

Document AI mendukung dua tingkat layanan dan kuota terkait untuk permintaan proses online ke versi pemroses yang didukung AI Generatif: tingkat yang disediakan dan tingkat upaya terbaik.

Kuota tingkat yang disediakan memberikan 120 halaman per menit untuk versi pemroses dasar, seperti pengekstrak kustom v1.4 dan v1.5, serta 30 halaman per menit untuk versi pemroses dasar seperti pengekstrak kustom v1.5 Pro.

Kuota tingkat upaya terbaik memberikan 120 untuk versi pemroses dasar seperti pengekstrak kustom v1.4 dan v1.5, 60 untuk versi pemroses Pro seperti pengekstrak kustom v1.5 Pro, dan hanya digunakan setelah kuota yang disediakan habis. Hal ini berlaku untuk kuota BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (metrik best_effort_online_process_document_pages_us), dan BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (metrik best_effort_online_process_document_pages_eu) di konsol.

Catatan Pemroses berdasarkan Gemini 2.0 Flash Pemroses berdasarkan Gemini 2.5 Flash Pemroses berdasarkan Gemini 2.5 Pro
Pemroses seperti: Pengekstrak kustom v1.4 Pengekstrak kustom v1.5 Semua versi Pro seperti Pengekstrak kustom v1.5 Pro dan v1.6 Pro
Disediakan 120 120 30
Upaya terbaik 120 120 60
Upaya terbaik dengan permintaan peningkatan kuota 240 240 120
Disediakan tingkat organisasi 240 240 60
Kapasitas yang dicadangkan, dibeli Tersedia Tersedia Tidak tersedia

Jika Anda memerlukan lebih dari kuota upaya terbaik yang tercantum, Anda dapat membuat permintaan peningkatan kuota (QIR) dengan menghubungi tim Penjualan.

Untuk mengamankan lebih banyak kapasitas yang tersedia selama traffic volume tinggi, baca bagian tentang cara membuat permintaan reservasi kapasitas.

Tidak ada perjanjian tingkat layanan untuk tingkat upaya terbaik.

Daftar kuota

Kuota berikut berlaku untuk Document AI. Kuota ini berlaku untuk setiap Google Cloud project konsol dan dibagikan ke semua aplikasi dan alamat IP yang menggunakan project tersebut.

Jika ingin memproses lebih banyak permintaan, kirimkan permintaan kuota Document AI untuk project Anda di Google Cloud konsol.

Berikan informasi tentang kebutuhan dan kasus penggunaan spesifik Anda dalam permintaan.

Kuota Permintaan Nilai Default Catatan
Permintaan per menit 1.800 per pengguna1 Lihat kuota di Google Cloud konsol
Permintaan proses online per menit (AS) 120 per project per jenis pemroses Lihat kuota di Google Cloud konsol
Permintaan proses online per menit (UE) 120 per project per jenis pemroses Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses online (AS) per menit per jenis pemroses dan versi model (Pengekstrak Kustom v1.4 dengan Gemini 2.0 Flash saja) 120 halaman per menit2 Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses online (UE) per menit per jenis pemroses dan versi model (Pengekstrak Kustom v1.4 dengan Gemini 2.0 Flash saja) 120 halaman per menit2 Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses online (AS) per menit per jenis pemroses dan versi model (Pengekstrak Kustom v1.5 dengan Gemini 2.5 Flash saja) 120 halaman per menit2 Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses online (UE) per menit per jenis pemroses dan versi model (Pengekstrak Kustom v1.5 dengan Gemini 2.5 Flash saja) 120 halaman per menit2 Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses upaya terbaik online (AS) per menit per jenis pemroses dan versi model 120 halaman per menit4 Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses upaya terbaik online (UE) per menit per jenis pemroses dan versi model 120 halaman per menit4 Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses upaya terbaik online (satu region) per menit per jenis pemroses dan versi model 120 halaman per menit4 Lihat kuota di Google Cloud konsol
Permintaan proses online per menit (satu region) 6 per project per jenis pemroses Lihat kuota di Google Cloud konsol
Permintaan proses batch serentak per project dan region (AS) 5 per project Lihat kuota di Google Cloud konsol
Permintaan proses batch serentak per project dan region (UE) 5 per project Lihat kuota di Google Cloud konsol
Permintaan proses batch serentak per pemroses (satu region) 5 per project Lihat kuota di Google Cloud konsol
Permintaan pelatihan versi pemroses serentak (AS) 1 per project Lihat kuota di Google Cloud konsol
Permintaan pelatihan versi pemroses serentak (UE) 1 per project Lihat kuota di Google Cloud konsol
Permintaan pelatihan versi pemroses serentak (satu region) 1 per project3 Lihat kuota di Google Cloud konsol
Versi pemroses kustom yang di-deploy (AS) 5 per project Lihat kuota di Google Cloud konsol
Versi pemroses kustom yang di-deploy (UE) 5 per project Lihat kuota di Google Cloud konsol
Versi pemroses kustom yang di-deploy (satu region) 5 per project Lihat kuota di Google Cloud konsol
Versi pemroses generatif yang di-deploy (AS) 100 per project per pemroses ekstraksi kustom Lihat kuota di Google Cloud konsol
Versi pemroses generatif yang di-deploy (UE) 100 per project per pemroses ekstraksi kustom Lihat kuota di Google Cloud konsol
Versi pemroses generatif yang di-deploy (satu region) 100 per project per pemroses ekstraksi kustom Lihat kuota di Google Cloud konsol
Permintaan impor dokumen serentak (AS) 3 per project Lihat kuota di Google Cloud konsol
Permintaan impor dokumen serentak (UE) 3 per project Lihat kuota di Google Cloud konsol
Permintaan impor dokumen serentak (satu region) 3 per project Lihat kuota di Google Cloud konsol
Permintaan ekspor dokumen serentak (AS) 1 per project Lihat kuota di Google Cloud konsol
Permintaan ekspor dokumen serentak (UE) 1 per project Lihat kuota di Google Cloud konsol
Permintaan ekspor dokumen serentak (satu region) 1 per project Lihat kuota di Google Cloud konsol
  1. Batch kuota permintaan per menit adalah untuk jumlah dokumen yang diminta per menit, bukan jumlah halaman atau panggilan API `batchProcess`.
  2. Permintaan penyesuaian kuota belum didukung untuk versi ini.
  3. Didukung di australia-southeast1 dengan permintaan penyesuaian kuota.
  4. Bervariasi bergantung pada versi Gemini, lihat tingkat layanan. Tinjau cara membuat permintaan reservasi kapasitas.

Jika project Anda memerlukan lebih banyak kapasitas, baca tentang Reservasi kapasitas.