Kuota dan batas

Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Gemini untuk Google Cloud.

  • Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
  • Batas sistem adalah nilai tetap yang tidak dapat diubah.

Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud sendiri.

Sistem Kuota Cloud melakukan hal berikut:

Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource melebihi kuota yang diizinkan, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.

Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia dalam project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Kuota Cloud.

Ada juga batas sistem pada resource Gemini. Batas sistem tidak dapat diubah.

Permintaan per detik

Gemini untuk Google Cloud menerapkan kuota pada permintaan per detik untuk setiap pengguna dalam project.

Kuota Nilai
Permintaan per detik 2

Permintaan per hari

Gemini untuk Google Cloud menerapkan kuota untuk jumlah total permintaan per hari untuk setiap pengguna dalam project.

Kuota Nilai
Permintaan per hari untuk Gemini Code Assist atau Gemini dalam permintaan kode BigQuery, seperti pembuatan kode dan penyelesaian kode. 6000
Permintaan per hari untuk chat, visualisasi, pemindaian tabel insight data, pembuatan metadata, penyiapan data, dan permintaan lainnya yang menampilkan respons di panel Cloud Assist di konsol dan IDE Google Cloud . 960

Kuota untuk Gemini Code Assist

Gemini Code Assist menerapkan kuota untuk fitur tertentu.

Kuota Nilai
Awareness codebase lokal Jendela konteks 1.000.000 token
Repositori penyesuaian kode 20.000

Kuota untuk mode agen dan Gemini CLI

Kuota untuk permintaan dari mode agen Gemini Code Assist dan Gemini CLI digabungkan. Saat berada dalam mode agen atau saat menggunakan Gemini CLI, satu perintah mungkin menghasilkan beberapa permintaan model. Permintaan dibatasi per pengguna per menit dan tunduk pada ketersediaan layanan saat permintaan tinggi. Batas permintaan harian ini digabungkan di semua interaksi dengan versi atau keluarga model (misalnya, Pro, Flash) yang digunakan dengan Gemini CLI atau mode agen. Setelah jumlah maksimum permintaan per hari tercapai, tidak ada permintaan lebih lanjut yang dapat dilakukan melalui antarmuka ini ke model apa pun hingga kuota direset.

Kuota Edisi Gemini Code Assist Nilai
Permintaan maksimum per pengguna per hari Standar 1500
Enterprise 2000

Kuota untuk Gemini Code Assist di GitHub

Penggunaan Gemini Code Assist di GitHub tidak dihitung sebagai bagian dari kuota umum untuk Gemini Code Assist.

  • Penginstalan aplikasi Gemini Code Assist di GitHub versi konsumen memiliki kuota 33 peninjauan permintaan pull per hari.

  • Penginstalan versi Enterprise dari Gemini Code Assist di aplikasi GitHub (Pratinjau) memiliki kuota minimal 100 peninjauan permintaan pull per hari.

    • Jumlah pasti peninjauan permintaan pull bergantung pada codebase dan jumlah panggilan model yang diperlukan untuk menyelesaikan setiap peninjauan kode. Oleh karena itu, dalam beberapa kasus, kuota dapat jauh lebih besar dari 100.

Kouta Gemini Code Assist di GitHub direset sesuai dengan reset untuk kouta Google Cloud .

Meminta penambahan kuota

Untuk menyesuaikan sebagian besar kuota, gunakan konsol Google Cloud . Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.