Ce document liste les quotas et limites système qui s'appliquent à Gemini pour Google Cloud.
- Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
- Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .
Le système Cloud Quotas permet d'effectuer les opérations suivantes :
- Surveiller votre consommation de produits et services Google Cloud
- Limiter votre consommation de ces ressources
- Demander des modifications de la valeur du quota et automatiser les ajustements de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.
Pour en savoir plus, consultez la présentation des quotas Cloud.
Des limites système s'appliquent également aux ressources Gemini. Elles ne peuvent pas être modifiées.
Requêtes par seconde
Gemini pour Google Cloud applique des quotas de requêtes par seconde pour chaque utilisateur d'un projet.
| Quota | Valeur |
|---|---|
| Requêtes par seconde | 2 |
Requêtes par jour
Gemini pour Google Cloud applique des quotas pour le nombre total de requêtes par jour pour chaque utilisateur d'un projet.
| Quota | Valeur |
|---|---|
| Requêtes de code par jour pour Gemini Code Assist ou Gemini dans BigQuery, comme la génération et la complétion de code. | 6000 |
| Requêtes par jour pour le chat, la visualisation, les analyses de tableaux d'insights sur les données, la génération de métadonnées, la préparation des données et les autres requêtes qui affichent des réponses dans le panneau Cloud Assist de la console Google Cloud et des IDE. | 960 |
Quotas pour Gemini Code Assist
Gemini Code Assist applique des quotas pour certaines fonctionnalités.
| Quota | Valeur |
|---|---|
| Visibilité du codebase local | Fenêtre de contexte d'un million de jetons |
| Dépôts de personnalisation du code | 20 000 |
Quotas pour le mode Agent et la CLI Gemini
Les quotas pour les requêtes du mode Agent Gemini Code Assist et de la CLI Gemini sont combinés. En mode Agent ou lorsque vous utilisez la CLI Gemini, un prompt peut générer plusieurs requêtes de modèle.
| Quota | Édition Gemini Code Assist | Valeur |
|---|---|---|
| Requêtes par utilisateur et par minute | Standard | 120 |
| Entreprise | 120 | |
| Requêtes par utilisateur et par jour | Standard | 1500 |
| Entreprise | 2000 |
Quotas pour Gemini Code Assist sur GitHub
L'utilisation de Gemini Code Assist sur GitHub n'est pas comptabilisée dans les quotas généraux de Gemini Code Assist.
Les utilisateurs de la version grand public de Gemini Code Assist sur GitHub disposent d'un quota de 33 revues de demande d'extraction'extraction par jour.
Les utilisateurs de la version Enterprise de Gemini Code Assist sur GitHub (version Preview) disposent d'un quota d'au moins 100 revues de demande d'extraction d'extraction par jour.
- Le nombre exact d'examens de demande d'extraction d'extraction dépend de la base de code et du nombre d'appels de modèle nécessaires pour effectuer chaque examen de code. Par conséquent, dans certains cas, le quota peut être nettement supérieur à 100.
Gemini dans BigQuery
Pour en savoir plus sur les limites de Gemini dans BigQuery, consultez la page Quotas et limites de BigQuery.
Demander une augmentation du quota
Pour ajuster la plupart des quotas, utilisez la console Google Cloud . Pour en savoir plus, consultez la section Demander un ajustement de quota.