Ce document répertorie les quotas et limites système qui s'appliquent à Model Armor.
- Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
- Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .
Le système Cloud Quotas permet d'effectuer les opérations suivantes :
- Surveiller votre consommation de produits et services Google Cloud
- Limiter votre consommation de ces ressources
- Demander des modifications de la valeur du quota et automatiser les ajustements de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.
Pour en savoir plus, consultez la présentation des quotas Cloud.
Quota de requêtes API
Vous pouvez augmenter ce quota dans la console Google Cloud , comme pour les autres services Google Cloud .
| Quota | Valeur |
|---|---|
| Requêtes API | 1 200 requêtes par minute (RPM) par projet |
Limite de taille du système pour les entrées
Le tableau suivant indique la limite de taille du fichier ou du texte d'entrée imposée par le système.
| Limite système | Valeur |
|---|---|
| Tous les fichiers compatibles et le texte | 4 Mo |
Limites de jetons du système
Model Armor applique des limites système variables sur les tokens en fonction du filtre spécifique.
| Filtre | Limite système |
|---|---|
| Détection de l'injection de prompts et du jailbreak | 10 000 |
| IA responsable | 10 000 |
| Contenus d'abus sexuels sur mineurs | 10 000 |
| Protection des données sensibles | 130 000 |
Lorsque la requête ou la réponse dépasse la limite de jetons, le filtre Sensitive Data Protection renvoie EXECUTION_SKIPPED. Tous les autres filtres renvoient MATCH_FOUND si la requête ou la réponse dépasse la limite de jetons et que du contenu malveillant est détecté dans les 10 000 premiers jetons, ou EXECUTION_SKIPPED si aucun contenu malveillant n'est détecté dans les 10 000 premiers jetons.
Obtenir les noms des métriques de quota et de limite système
Les quotas et les limites du système ont deux types de noms : les noms à afficher et les noms de métriques. Les noms à afficher contiennent des espaces et des majuscules pour en faciliter la lecture. Les noms de métriques sont plus susceptibles d'être en minuscules et délimités par des traits de soulignement plutôt que par des espaces. Le format exact dépend du service.
Les instructions suivantes expliquent comment obtenir les noms de métriques pour les quotas et les limites système à l'aide de la console Google Cloud ou de gcloud CLI.
Console
Dans la console Google Cloud , accédez à la page IAM et administration> Quotas et limites du système :
Accéder à la page Quotas et limites du système
Le tableau sur cette page affiche les quotas et les limites système qui ont une utilisation ou des valeurs ajustées, ainsi qu'une entrée de référence pour les autres quotas. L'entrée de référence comporte le mot "default" (par défaut) entre parenthèses à la fin de la liste dans la colonne Nom. Par exemple,
SetIAMPolicy requests per minute per region (default)est l'entrée de référence pour le quotaSetIamPolicyRequestsPerMinutePerProject.Si vous ne voyez pas la colonne Métrique, procédez comme suit.
- Cliquez sur Options d'affichage des colonnes.
- Sélectionnez Metric (Métrique).
- Cliquez sur OK. La colonne Métrique s'affiche dans le tableau.
La colonne Métrique affiche les noms des métriques. Pour filtrer les résultats, saisissez un nom ou une valeur de propriété dans le champ à côté de Filtrer.
gcloud
Pour obtenir les noms de métriques d'un service Google Cloud à l'aide de la gcloud CLI, exécutez la commande quotas info list. Pour ignorer les lignes qui ne listent pas les noms de métriques, transmettez la sortie à une commande telle que grep avec metric: comme terme de recherche, ou utilisez l'indicateur --format de gcloud CLI :
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
Remplacez les éléments suivants :
PROJECT_ID_OR_NUMBER: ID ou numéro du projet.SERVICE_NAME: nom du service dont vous souhaitez afficher les métriques de quota. Par exemple, le nom du service Compute Engine estcompute.googleapis.com. Incluez la partiegoogleapis.comdu nom du service.
Demander un ajustement de quota
Pour ajuster la plupart des quotas, utilisez la console Google Cloud . Pour en savoir plus, consultez la section Demander un ajustement de quota.