Ce document répertorie les quotas et limites système qui s'appliquent à Model Armor.
- Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
- Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .
Le système Cloud Quotas permet d'effectuer les opérations suivantes :
- Surveiller votre consommation de produits et services Google Cloud
- Limiter votre consommation de ces ressources
- Demander des modifications de la valeur du quota et automatiser les ajustements de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.
Pour en savoir plus, consultez la présentation des quotas Cloud.
Quotas de l'API Model Armor
Le tableau suivant indique les quotas de l'API Model Armor.
| Quota | Valeur |
|---|---|
| Requêtes API | 1 200 requêtes par minute (RPM) par projet |
| Requêtes adressées à ExternalProcessor | 600 RPM par projet1 |
Vous pouvez appliquer une valeur comprise entre 0 et 1 200 requêtes par minute par projet. Pour demander un ajustement, consultez Demander un ajustement de quota. Si vous avez besoin d'un quota supérieur à celui par défaut, contactez Cloud Customer Care.
Pour en savoir plus sur les quotas liés aux intégrations Model Armor avec d'autres services, consultez Gérer les quotas.
1 Pertinent si vous intégrez Model Armor à d'autres services Google Cloud .
Limite de taille du système pour les entrées
Le tableau suivant indique la limite de taille du fichier ou du texte d'entrée imposée par le système. Model Armor ignore les fichiers ou le texte qui dépassent cette limite.
| Limite système | Valeur |
|---|---|
| Tous les fichiers compatibles et le texte | 4 Mo |
Limites de jetons du système
Model Armor applique des limites système variables sur les tokens en fonction du filtre spécifique.
| Filtre | Limite système |
|---|---|
| Détection de l'injection de prompt et du jailbreaking | 10 000 |
| IA responsable | 10 000 |
| Contenus d'abus sexuels sur mineurs | 10 000 |
| Protection des données sensibles | 130 000 |
Lorsque la requête ou la réponse dépasse la limite de jetons, le filtre Sensitive Data Protection renvoie EXECUTION_SKIPPED. Si la requête ou la réponse dépasse la limite de jetons, tous les autres filtres renvoient MATCH_FOUND si du contenu malveillant est détecté dans les 10 000 premiers jetons ou EXECUTION_SKIPPED si aucun contenu malveillant n'est détecté dans les 10 000 premiers jetons.
Obtenir les noms des métriques de quota et de limite système
Les quotas et les limites du système ont deux types de noms : les noms à afficher et les noms de métriques. Les noms à afficher contiennent des espaces et des majuscules pour faciliter la lecture. Les noms de métriques sont plus susceptibles d'être en minuscules et délimités par des traits de soulignement plutôt que par des espaces. Le format exact dépend du service.
Les instructions suivantes montrent comment obtenir les noms de métriques pour les quotas et les limites système à l'aide de la console Google Cloud ou de gcloud CLI.
Console
Dans la console Google Cloud , accédez à la page IAM et administration> Quotas et limites du système :
Accéder à la page Quotas et limites du système
Le tableau sur cette page affiche les quotas et les limites système qui ont une utilisation ou des valeurs ajustées, ainsi qu'une entrée de référence pour les autres quotas. L'entrée de référence comporte le mot "default" (par défaut) entre parenthèses à la fin de la liste dans la colonne Nom. Par exemple,
SetIAMPolicy requests per minute per region (default)est l'entrée de référence pour le quotaSetIamPolicyRequestsPerMinutePerProject.Si la colonne Métrique n'apparaît pas, procédez comme suit.
- Cliquez sur Options d'affichage des colonnes.
- Sélectionnez Metric (Métrique).
- Cliquez sur OK. La colonne Métrique s'affiche dans le tableau.
La colonne Métrique affiche les noms des métriques. Pour filtrer les résultats, saisissez un nom ou une valeur de propriété dans le champ à côté de Filtrer.
gcloud
Pour obtenir les noms de métriques d'un service Google Cloud à l'aide de la gcloud CLI, exécutez la commande quotas info list. Pour ignorer les lignes qui ne listent pas les noms de métriques, transmettez le résultat à une commande telle que grep avec metric: comme terme de recherche, ou utilisez l'indicateur --format de la gcloud CLI :
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
Remplacez les éléments suivants :
PROJECT_ID_OR_NUMBER: ID ou numéro du projet.SERVICE_NAME: nom du service dont vous souhaitez afficher les métriques de quota. Par exemple, le nom du service Compute Engine estcompute.googleapis.com. Incluez la partiegoogleapis.comdu nom du service.