Quotas et limites du système

Ce document répertorie les quotas et limites système qui s'appliquent à Model Armor.

  • Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
  • Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .

Le système Cloud Quotas permet d'effectuer les opérations suivantes :

Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.

Pour en savoir plus, consultez la présentation des quotas Cloud.

Quota de requêtes API

Vous pouvez augmenter ce quota dans la console Google Cloud , comme pour les autres services Google Cloud .

Quota Valeur
Requêtes API 1 200 requêtes par minute (RPM) par projet

Limite de taille du système pour les entrées

Le tableau suivant indique la limite de taille du fichier ou du texte d'entrée imposée par le système.

Limite système Valeur
Tous les fichiers compatibles et le texte 4 Mo

Limites de jetons du système

Model Armor applique des limites système variables sur les tokens en fonction du filtre spécifique.

Filtre Limite système
Détection de l'injection de prompts et du jailbreak 10 000
IA responsable 10 000
Contenus d'abus sexuels sur mineurs 10 000
Protection des données sensibles 130 000

Lorsque la requête ou la réponse dépasse la limite de jetons, le filtre Sensitive Data Protection renvoie EXECUTION_SKIPPED. Tous les autres filtres renvoient MATCH_FOUND si la requête ou la réponse dépasse la limite de jetons et que du contenu malveillant est détecté dans les 10 000 premiers jetons, ou EXECUTION_SKIPPED si aucun contenu malveillant n'est détecté dans les 10 000 premiers jetons.

Obtenir les noms des métriques de quota et de limite système

Les quotas et les limites du système ont deux types de noms : les noms à afficher et les noms de métriques. Les noms à afficher contiennent des espaces et des majuscules pour en faciliter la lecture. Les noms de métriques sont plus susceptibles d'être en minuscules et délimités par des traits de soulignement plutôt que par des espaces. Le format exact dépend du service.

Les instructions suivantes expliquent comment obtenir les noms de métriques pour les quotas et les limites système à l'aide de la console Google Cloud ou de gcloud CLI.

Console

  1. Dans la console Google Cloud , accédez à la page IAM et administration> Quotas et limites du système :

    Accéder à la page Quotas et limites du système

    Le tableau sur cette page affiche les quotas et les limites système qui ont une utilisation ou des valeurs ajustées, ainsi qu'une entrée de référence pour les autres quotas. L'entrée de référence comporte le mot "default" (par défaut) entre parenthèses à la fin de la liste dans la colonne Nom. Par exemple, SetIAMPolicy requests per minute per region (default) est l'entrée de référence pour le quota SetIamPolicyRequestsPerMinutePerProject.

  2. Si vous ne voyez pas la colonne Métrique, procédez comme suit.

    1. Cliquez sur Options d'affichage des colonnes.
    2. Sélectionnez Metric (Métrique).
    3. Cliquez sur OK. La colonne Métrique s'affiche dans le tableau.

La colonne Métrique affiche les noms des métriques. Pour filtrer les résultats, saisissez un nom ou une valeur de propriété dans le champ à côté de Filtrer.

gcloud

Pour obtenir les noms de métriques d'un service Google Cloud à l'aide de la gcloud CLI, exécutez la commande quotas info list. Pour ignorer les lignes qui ne listent pas les noms de métriques, transmettez la sortie à une commande telle que grep avec metric: comme terme de recherche, ou utilisez l'indicateur --format de gcloud CLI :

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

Remplacez les éléments suivants :

  • PROJECT_ID_OR_NUMBER : ID ou numéro du projet.
  • SERVICE_NAME : nom du service dont vous souhaitez afficher les métriques de quota. Par exemple, le nom du service Compute Engine est compute.googleapis.com. Incluez la partie googleapis.com du nom du service.

Demander un ajustement de quota

Pour ajuster la plupart des quotas, utilisez la console Google Cloud . Pour en savoir plus, consultez la section Demander un ajustement de quota.