Ce document liste les quotas et limites système pour Gemini Enterprise. Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées. Contrairement à d'autres Google Cloud services, les quotas Gemini Enterprise ne nécessitent pas de demandes d'augmentation manuelles. Les quotas sont ajustés automatiquement en fonction du nombre de licences ou de postes que vous achetez.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .
Le système Cloud Quotas permet d'effectuer les opérations suivantes :
- Surveiller votre consommation de produits et services Google Cloud
- Limiter votre consommation de ces ressources
- Demander des modifications de la valeur du quota et automatiser les ajustements de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.
Pour en savoir plus, consultez la présentation des quotas Cloud.
Des limites système s'appliquent également aux ressources Gemini Enterprise. Elles ne peuvent pas être modifiées.
Pour en savoir plus sur les tarifs en cas de dépassement pour Gemini Enterprise, consultez Quotas et dépassements.
Les quotas d'allocation
Le tableau suivant répertorie les quotas pour l'API Discovery Engine. Ces quotas ne sont pas réinitialisés au fil du temps. Au lieu de cela, ils sont libérés lorsque vous libérez la ressource.
| Quota | Valeur |
|---|---|
| Nombre total de datastores par projet | 1001 |
| Nombre total de moteurs par projet | 1502 |
| Nombre régional de datastores par projet et par emplacement (global, États-Unis, UE) | 100 |
| Nombre régional de documents par projet et par emplacement (global, États-Unis, UE) | 10 000 000 |
| Nombre régional de moteurs par projet et par emplacement (global, États-Unis, UE) | 150 |
1 En raison d'une limitation technique, le quota maximal pour les datastores est de
500 par projet. Si vous avez besoin de plus de datastores, utilisez de nouveaux projets.
Chaque entité d'un data store est comptabilisée comme une instance de data store et,
est donc prise en compte dans ce quota. Par exemple, un data store comportant trois
entités est comptabilisé comme trois datastores par rapport à votre quota.
2 En raison d'une limitation technique, le quota maximal pour les moteurs est de 500 par projet. Si vous avez besoin de plus de moteurs, utilisez de nouveaux projets.
Les quotas de débit
Les quotas suivants s'appliquent aux requêtes de l'API Discovery Engine.
| Quota | Valeur |
|---|---|
| Requêtes de requête complète par minute et par projet | 300 |
| Requêtes de recherche régionales par minute, par projet et par emplacement (global, États-Unis, UE) | 300 |