Quotas et limites du système

Ce document liste les quotas et limites système qui s'appliquent à Gemini Enterprise.

  • Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
  • Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .

Le système Cloud Quotas permet d'effectuer les opérations suivantes :

Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.

Pour en savoir plus, consultez la présentation des quotas Cloud.

Des limites système s'appliquent également aux ressources Gemini Enterprise. Elles ne peuvent pas être modifiées.

Pour en savoir plus sur les tarifs en cas de dépassement pour Gemini Enterprise, consultez Quotas et dépassements.

Les quotas d'allocation

Le tableau suivant répertorie les quotas pour l'API Discovery Engine. Ces quotas ne sont pas réinitialisés au fil du temps. mais sont libérés lorsque vous libérez la ressource. Vous pouvez demander une augmentation de quota si le quota par défaut ne suffit pas.

Quota Valeur
Nombre total de data stores par projet 100*
Nombre total de moteurs par projet 150
Nombre régional de data stores par projet et par emplacement (monde, États-Unis, UE) 100
Nombre régional de documents par projet et par emplacement (monde, États-Unis, UE) 10 000 000
Nombre régional de moteurs par projet et par emplacement (global, États-Unis, Europe) 150

* En raison d'une limitation technique, le quota maximal de data stores est de 500 par projet. Si vous avez besoin d'autres data stores, utilisez de nouveaux projets.

 En raison d'une limitation technique, le quota maximal de moteurs est de 500 par projet. Si vous avez besoin de plus de moteurs, utilisez de nouveaux projets.

Les quotas de débit

Les quotas suivants s'appliquent aux requêtes de l'API Discovery Engine. Si le quota par défaut ne suffit pas, vous pouvez demander une augmentation de quota.

Quota Valeur
Requêtes complètes par minute et par projet 300
Requêtes de recherche régionales par minute, par projet et par emplacement (monde, États-Unis, Europe) 300

Demander une augmentation du quota

Pour ajuster la plupart des quotas, utilisez la console Google Cloud . Pour en savoir plus, consultez la section Demander un ajustement de quota.