Quotas et limites du système

Ce document liste les quotas et limites système pour Gemini Enterprise. Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées. Contrairement à d'autres Google Cloud services, les quotas Gemini Enterprise ne nécessitent pas de demandes d'augmentation manuelles. Les quotas sont ajustés automatiquement en fonction du nombre de licences ou de postes que vous achetez.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .

Le système Cloud Quotas permet d'effectuer les opérations suivantes :

Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.

Pour en savoir plus, consultez la présentation des quotas Cloud.

Des limites système s'appliquent également aux ressources Gemini Enterprise. Elles ne peuvent pas être modifiées.

Pour en savoir plus sur les tarifs en cas de dépassement pour Gemini Enterprise, consultez Quotas et dépassements.

Les quotas d'allocation

Le tableau suivant répertorie les quotas pour l'API Discovery Engine. Ces quotas ne sont pas réinitialisés au fil du temps. Au lieu de cela, ils sont libérés lorsque vous libérez la ressource.

Quota Valeur
Nombre total de datastores par projet 1001
Nombre total de moteurs par projet 1502
Nombre régional de datastores par projet et par emplacement (global, États-Unis, UE) 100
Nombre régional de documents par projet et par emplacement (global, États-Unis, UE) 10 000 000
Nombre régional de moteurs par projet et par emplacement (global, États-Unis, UE) 150

1 En raison d'une limitation technique, le quota maximal pour les datastores est de 500 par projet. Si vous avez besoin de plus de datastores, utilisez de nouveaux projets.
Chaque entité d'un data store est comptabilisée comme une instance de data store et, est donc prise en compte dans ce quota. Par exemple, un data store comportant trois entités est comptabilisé comme trois datastores par rapport à votre quota.

2 En raison d'une limitation technique, le quota maximal pour les moteurs est de 500 par projet. Si vous avez besoin de plus de moteurs, utilisez de nouveaux projets.

Les quotas de débit

Les quotas suivants s'appliquent aux requêtes de l'API Discovery Engine.

Quota Valeur
Requêtes de requête complète par minute et par projet 300
Requêtes de recherche régionales par minute, par projet et par emplacement (global, États-Unis, UE) 300