Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Gemini Enterprise.
- Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
- Batas sistem adalah nilai tetap yang tidak dapat diubah.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource sendiri. Google Cloud
Sistem Kuota Cloud melakukan hal berikut:
- Memantau penggunaan Google Cloud produk dan layanan
- Membatasi pemakaian resource tersebut
- Menyediakan cara untuk meminta perubahan pada nilai kuota dan mengotomatiskan penyesuaian kuota
Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource lebih dari yang diizinkan kuotanya, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level Google Cloud project Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.
Ada juga batas sistem pada resource Gemini Enterprise. Batas sistem tidak dapat diubah.
Untuk mengetahui informasi tentang harga penggunaan di luar batas untuk Gemini Enterprise, lihat Kuota dan penggunaan di luar batas.
Kuota alokasi
Tabel berikut mencantumkan kuota untuk Discovery Engine API. Kuota ini tidak direset dari waktu ke waktu. Sebaliknya, kuota tersebut akan dilepaskan saat Anda merilis resource. Anda dapat meminta penambahan kuota jika kuota default tidak cukup.
Kuota | Nilai |
---|---|
Jumlah total penyimpanan data per project | 100* |
Jumlah total mesin per project | 150† |
Jumlah operasi lama impor yang tertunda per project | 300 |
Jumlah operasi yang berjalan lama untuk menghapus dokumen yang tertunda per project | 100 |
Jumlah kontrol penayangan per project | 1.000 |
Jumlah kontrol inferensi peningkat per konfigurasi inferensi | 100 |
Jumlah kontrol penayangan filter per konfigurasi penayangan | 100 |
Jumlah kontrol penayangan pengalihan per konfigurasi penayangan | 100 |
Jumlah kontrol penayangan sinonim per konfigurasi penayangan | 100 |
Jumlah penyimpanan data regional per project per lokasi (Global, AS, Uni Eropa) | 100 |
Jumlah dokumen regional per project per lokasi (Global, AS, Uni Eropa) | 10.000.000 |
Jumlah mesin per project per lokasi (Global, AS, Uni Eropa) | 150 |
Jumlah peristiwa pengguna regional per project per lokasi (Global, AS, Uni Eropa) | 40.000.000.000 |
* Karena keterbatasan teknis, kuota maksimum untuk penyimpanan data adalah 500 per project. Jika Anda memerlukan penyimpanan data lainnya, gunakan project baru.
† Karena keterbatasan teknis, kuota maksimum untuk mesin adalah 500 per project. Jika Anda memerlukan lebih banyak mesin, gunakan project baru.
Kuota kapasitas
Kuota berikut berlaku untuk permintaan Discovery Engine API. Jika kuota default tidak cukup, Anda dapat meminta penambahan kuota.
Kuota | Nilai |
---|---|
Permintaan kueri lengkap per menit per project | 300 |
Permintaan baca penelusuran percakapan per menit per project | 300 |
Permintaan tulis penelusuran percakapan per menit per project | 300 |
Permintaan batch dokumen (seperti impor dan penghapusan inline) per menit per project | 100 |
Mendokumentasikan permintaan impor asinkron (Cloud Storage, BigQuery, dll.) per menit per project | 5 |
Permintaan penghapusan dokumen per menit per project | 100 |
Permintaan baca dokumen per menit per project | 300 |
Permintaan tulis dokumen per menit per project | 12.000 |
Permintaan pembuatan evaluasi per hari per project | 5 |
Permintaan baca evaluasi per menit per project | 100 |
Permintaan tulis evaluasi per menit per project | 100 |
Permintaan pemeriksaan perujukan pembuatan berbasis perujukan per menit per project | 300 |
Permintaan kueri LLM (ringkasan penelusuran, penelusuran multi-turn) per menit per project | 60 |
Jumlah penulisan streaming FHIR atau BigQuery yang tertunda per menit | 6.000 |
Jumlah set kueri contoh per project | 100 |
Permintaan Ranking API per menit per project | 500 |
Permintaan rekomendasi per menit per project | 60.000 |
Contoh permintaan baca kueri per menit per project | 200 |
Permintaan baca set kueri contoh per menit per project | 100 |
Permintaan tulis set kueri contoh per menit per project | 100 |
Contoh permintaan tulis kueri per menit per project | 200 |
Permintaan baca skema per menit per project | 100 |
Permintaan tulis skema per menit per project | 100 |
Permintaan penelusuran regional per menit per project per lokasi (Global, AS, Uni Eropa) | 300 |
Permintaan batch peristiwa pengguna (seperti impor dan penghapusan) per menit per project | 100 |
Permintaan pengumpulan peristiwa pengguna per menit per project per pengguna | 240 |
Permintaan tulis peristiwa pengguna per menit per project | 60.000 |
Meminta penambahan kuota
Untuk menyesuaikan sebagian besar kuota, gunakan konsol Google Cloud . Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.