Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Gemini untuk Google Cloud.
- Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
- Batas sistem adalah nilai tetap yang tidak dapat diubah.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud sendiri.
Sistem Kuota Cloud melakukan hal berikut:
- Memantau pemakaian Google Cloud produk dan layanan
- Membatasi pemakaian resource tersebut
- Menyediakan cara untuk meminta perubahan pada nilai kuota dan mengotomatiskan penyesuaian kuota
Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource melebihi kuota yang diizinkan, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia dalam project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.
Untuk mengetahui informasi selengkapnya, lihat Ringkasan Kuota Cloud.
Ada juga batas sistem pada resource Gemini. Batas sistem tidak dapat diubah.
Permintaan per detik
Gemini untuk Google Cloud menerapkan kuota pada permintaan per detik untuk setiap pengguna dalam project.
| Kuota | Nilai |
|---|---|
| Permintaan per detik | 2 |
Permintaan per hari
Gemini untuk Google Cloud menerapkan kuota untuk jumlah total permintaan per hari untuk setiap pengguna dalam project.
| Kuota | Nilai |
|---|---|
| Permintaan per hari untuk Gemini Code Assist atau Gemini dalam permintaan kode BigQuery, seperti pembuatan kode dan penyelesaian kode. | 6000 |
| Permintaan per hari untuk chat, visualisasi, pemindaian tabel insight data, pembuatan metadata, penyiapan data, dan permintaan lainnya yang menampilkan respons di panel Cloud Assist di konsol dan IDE Google Cloud . | 960 |
Kuota untuk Gemini Code Assist
Gemini Code Assist menerapkan kuota untuk fitur tertentu.
| Kuota | Nilai |
|---|---|
| Awareness codebase lokal | Jendela konteks 1.000.000 token |
| Repositori penyesuaian kode | 20.000 |
Kuota untuk mode agen dan Gemini CLI
Kuota untuk permintaan dari mode agen Gemini Code Assist dan Gemini CLI digabungkan. Saat dalam mode agen atau saat menggunakan Gemini CLI, satu perintah dapat menghasilkan beberapa permintaan model.
| Kuota | Edisi Gemini Code Assist | Nilai |
|---|---|---|
| Permintaan per pengguna per menit | Standar | 120 |
| Enterprise | 120 | |
| Permintaan per pengguna per hari | Standar | 1500 |
| Enterprise | 2000 |
Kuota untuk Gemini Code Assist di GitHub
Penggunaan Gemini Code Assist di GitHub tidak dihitung sebagai bagian dari kuota umum untuk Gemini Code Assist.
Pengguna Gemini Code Assist versi konsumen di GitHub memiliki kuota 33 ulasan permintaan pull per hari.
Pengguna Gemini Code Assist versi perusahaan di GitHub (Pratinjau) memiliki kuota minimal 100 ulasan permintaan pull per hari.
- Jumlah persis peninjauan pull request bergantung pada codebase dan jumlah panggilan model yang diperlukan untuk menyelesaikan setiap peninjauan kode. Oleh karena itu, dalam beberapa kasus, kuota dapat jauh lebih besar dari 100.
Gemini in BigQuery
Untuk mengetahui informasi tentang batas Gemini di BigQuery, lihat Kuota dan batas BigQuery.
Meminta penambahan kuota
Untuk menyesuaikan sebagian besar kuota, gunakan konsol Google Cloud . Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.