Kuota dan batas

Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Gemini for Google Cloud.

  • Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
  • Batas sistem adalah nilai tetap yang tidak dapat diubah.

Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud sendiri.

Sistem Kuota Cloud melakukan hal berikut:

Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource melebihi kuota yang diizinkan, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.

Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia dalam project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.

Untuk mengetahui informasi selengkapnya, lihat Ringkasan Kuota Cloud.

Ada juga batas sistem pada resource Gemini. Batas sistem tidak dapat diubah.

Permintaan per detik

Gemini for Google Cloud menerapkan kuota pada permintaan per detik untuk setiap pengguna dalam project.

Quota Nilai
Permintaan per detik 2

Permintaan per hari

Gemini for Google Cloud menerapkan kuota untuk jumlah total permintaan per hari untuk setiap pengguna dalam project.

Quota Nilai
Permintaan per hari untuk Gemini Code Assist atau permintaan kode Gemini di BigQuery, seperti pembuatan kode dan penyelesaian kode. 6000
Permintaan per hari untuk chat, visualisasi, pemindaian tabel insight data, pembuatan metadata, persiapan data, dan permintaan lainnya yang menampilkan respons di panel Cloud Assist di Google Cloud konsol dan IDE. 960

Kuota untuk Gemini Code Assist

Gemini Code Assist menerapkan kuota untuk fitur tertentu.

Quota Nilai
Awareness codebase lokal Jendela konteks 1.000.000 token
Repositori penyesuaian kode 20.000

Kuota untuk mode agen dan Gemini CLI

Kuota untuk permintaan dari mode agen Gemini Code Assist dan Gemini CLI digabungkan. Saat berada dalam mode agen atau saat menggunakan Gemini CLI, satu perintah dapat menghasilkan beberapa permintaan model. Permintaan dibatasi per pengguna per menit dan tunduk pada ketersediaan layanan pada saat permintaan tinggi. Batas permintaan harian ini diagregasi di semua interaksi dengan versi atau famili model apa pun (misalnya, Pro, Flash) yang digunakan dengan Gemini CLI atau mode agen. Setelah jumlah maksimum permintaan per hari tercapai, tidak ada permintaan lebih lanjut yang dapat dilakukan melalui antarmuka ini ke model mana pun hingga kuota direset.

Quota Edisi Gemini Code Assist Nilai
Permintaan maksimum per pengguna per hari Standar 1500
Enterprise 2000

Kuota untuk Gemini Code Assist di GitHub

Penggunaan Gemini Code Assist di GitHub tidak dihitung sebagai bagian dari kuota umum untuk Gemini Code Assist.

Kuota Gemini Code Assist di GitHub direset sesuai dengan reset untuk Google Cloud kuota.

Meminta penambahan kuota

Untuk menyesuaikan sebagian besar kuota, gunakan Google Cloud konsol. Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.