Quotas et limites de Cloud Run

Cette page présente les limites et quotas d'utilisation applicables lors de l'utilisation de Cloud Run.

Le nombre de ressources Cloud Run est limité. Les quotas pour Cloud Run incluent les limites de débit des API, ce qui affecte la fréquence à laquelle vous pouvez appeler l'API Admin Cloud Run.

Aucune limite directe ne concerne :

  • la taille des images de conteneurs que vous pouvez déployer ;
  • Nombre de requêtes simultanées diffusées par un service Cloud Run.

Limites de ressources pour Cloud Run

Pour dépasser les limites qui peuvent être augmentées, demandez une augmentation de quota. Pour dépasser les limites par projet qui ne peuvent pas être augmentées, créez des ressources dans un autre projet ou une autre région Google Cloud .

Ressource Champ d'application Description Limite Augmentation possible
Service Par projet et par région Nombre maximal de services 1 000 Non
Job Par projet et par région Nombre maximal de jobs 1000 Non
Pool de nœuds de calcul Par projet et par région Nombre maximal de pools de nœuds de calcul 1000 Non
Exécution du job Par projet et par région Nombre maximal d'exécutions de jobs en cours 1000 Non
Révision Par service Nombre maximal de révisions par service. Une fois la limite atteinte, les révisions inactives sont automatiquement supprimées dans l'ordre chronologique 1 000 Non
Révision Par projet et par région Nombre maximal de révisions diffusant le trafic 4000 Non
Tag de révision Par projet et par région Nombre maximal de tags de révision. Lorsque la limite de tags de révision est dépassée, Cloud Run effectue un nettoyage des tags sur le service. Pour le service pour lequel un nouveau tag est créé, les tags qui ne sont pas associés à un pourcentage de trafic spécifié sont automatiquement supprimés dans l'ordre chronologique. 2000 Non
Exécution du job par job Limite de conservation pour les exécutions de jobs terminées. Lorsque le nombre d'exécutions d'un job terminées atteint cette limite, les exécutions sont automatiquement supprimées dans l'ordre chronologique 1 000 Non
Tâche d'exécution de jobs1 par exécution de job Nombre maximal de tâches exécutées en parallèle Dépend de la région sélectionnée et des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. Vous pouvez consulter votre quota sur la page Quotas et limites du système de la console. Oui
Job d'exécution du job par exécution de job Valeur maximale du délai avant expiration des tâches 168 heures (7 jours) ou 1 heure si vous utilisez des GPU Non
Job d'exécution du job par exécution de job Nombre maximal d'opérations dans un job unique 10 000 Non
Job d'exécution du job par exécution de job Nombre maximal de nouvelles tentatives d'exécution d'une opération dans un job 10 Non
Variables d'environnement par job ou par service. Nombre maximal de variables d'environnement pour chaque conteneur 1000 Non
Arguments de la commande par job ou par service. Nombre maximal d'arguments de commande pour chaque conteneur 1000 Non
Instance de conteneur3 par révision et par région Nombre maximal d'instances de conteneur utilisant la sortie VPC directe 100 à 200, en fonction des configurations de région sélectionnées. Oui
Instance de conteneur Par instance de conteneur Délai avant expiration du démarrage, en minutes 4 Non
Mémoire Par instance de conteneur Taille maximale de la mémoire, en Gio 32 Non
Processeur Par instance de conteneur Nombre maximal de processeurs virtuels 8 Non
Processeur1 Par projet et par région Processeur total maximal, en millièmes de vCPU, alloué à toutes les instances sur une période d'une minute. Dépend de la région sélectionnée. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. Oui
Mémoire1 Par projet et par région Mémoire totale maximale, en octets, allouée à toutes les instances sur une période d'une minute. Dépend de la région sélectionnée. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. Vous pouvez consulter votre quota sur la page Quotas et limites du système de la console. Oui
Instance de GPU sans garantie de redondance zonale1, 4 par projet et par région Nombre maximal d'instances de conteneur avec GPU 04 Oui
Instance de GPU avec garantie de redondance zonale1, 4 par projet et par région Nombre maximal d'instances de conteneur avec GPU 04 Oui
Disque Par instance de conteneur Système de fichiers maximal en mémoire, accessible en écriture, limité par la mémoire d'instance, en Gio 32 Non
Variable d'environnement Par variable Longueur maximale de la variable, en Ko 32 Non
Mappage de domaine Par domaine de premier niveau et par semaine Nombre maximal de certificats SSL 50 Non
Mappage de domaine Par domaine de premier niveau et par semaine Nombre maximal de certificats SSL en double 5 Non
Jeton d'accès Par instance de conteneur et par seconde Nombre maximal de jetons d'accès uniques générés 50 Non
Jeton d'identité Par instance de conteneur et par seconde Nombre maximal de jetons d'identité uniques générés 50 Non
Fichiers ouverts Par instance de conteneur Nombre maximal de fichiers pouvant être ouverts simultanément. Correspond à
/proc/sys/fs/file-max.
25 000 Non

1Ces quotas régionaux sont utilisés dans certains cas précis, où chacun contrôle :

  1. La valeur maximale pouvant être sélectionnée pour l'attribut d'instance maximale d'une révision. Une fois ce quota accordé dans une région donnée, toutes les révisions de cette région peuvent atteindre la limite accordée.

  2. Le parallélisme maximal d'un job. Une fois ce quota accordé dans une région donnée, tous les jobs de cette région peuvent atteindre la limite accordée.

  3. Nombre total d'instances de conteneur pour l'exécution de jobs dans une région.

3Ce quota régional est utilisé dans certains cas précis :

  1. Pour contrôler la valeur maximale pouvant être sélectionnée pour l'attribut d'instance maximale d'une révision à l'aide de la sortie VPC directe. Une fois ce quota accordé dans une région donnée, toutes les révisions de cette région peuvent atteindre la limite accordée.

  2. Pour contrôler le parallélisme maximal d'un job à l'aide de la sortie VPC directe. Une fois ce quota accordé dans une région donnée, tous les jobs de cette région peuvent atteindre la limite accordée.

4 : les nouveaux projets qui créent un service avec des GPU L4 se verront automatiquement attribuer 3 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Vous pouvez également demander le quota NvidiaL4GpuAllocPerProjectRegion ou NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Si votre utilisation maximale des GPU n'est pas proche de votre quota, Google peut le réduire.

Limites de mise en réseau pour Cloud Run

Limites de requêtes pour Cloud Run

Description Limite Remarques
Nombre maximal de requêtes simultanées par instance 1000
Nombre maximal de flux simultanés par connexion client HTTP/2 100
Délai maximal avant expiration par requête 60 minutes
Taille maximale des requêtes HTTP/1 32 Mio si vous utilisez le serveur HTTP/1. Aucune limite si vous utilisez un serveur HTTP/2.
Taille maximale des réponses HTTP/1 32 Mio si vous n'utilisez pas Transfer-Encoding: chunked ni les mécanismes de streaming
Nombre maximal de connexions ouvertes par instance et par type de sortie (Internet ou VPC) 50 000 Ne s'applique pas au trafic de sortie VPC directe.
Connexions sortantes par seconde et par instance 700 Ne s'applique pas au trafic de sortie VPC direct envoyé au réseau VPC, qui n'est pas limité.
Connexions sortantes par minute et par instance 5000 Ne s'applique pas au trafic de sortie VPC direct envoyé au réseau VPC, qui n'est pas limité.
Résolutions DNS sortantes par seconde et par instance 1000
Requêtes entrantes par seconde vers un port de conteneur HTTP/1 par instance 800 Ne s'applique pas aux ports de conteneurs HTTP/2.

Limites de bande passante pour Cloud Run

Les limites de bande passante suivantes s'appliquent aux instances Cloud Run :

Description Limite Remarques
Nombre maximal d'octets par instance pour la sortie via un VPC direct 1 Gbit/s Sortie via un VPC direct vers des destinations situées sur le réseau VPC.
Nombre maximal d'octets par instance, en excluant la sortie via VPC direct 600 Mbit/s Basé sur la somme des octets d'entrée et des octets de sortie, à l'exclusion de la sortie via un VPC direct vers des destinations situées sur le réseau VPC.
Débit total maximal de paquets par instance, à l'exclusion de la sortie via un VPC direct 64 000 paquets par seconde Basé sur la somme des paquets d'entrée et des paquets de sortie, à l'exclusion de la sortie via un VPC direct vers des destinations situées sur le réseau VPC.

Si l'une des deux limites est atteinte, la bande passante de l'instance Cloud Run sera limitée.

Limites de débit de l'API Admin Cloud Run

Les limites de débit suivantes s'appliquent à l'API Admin Cloud Run. Elles ne s'appliquent pas aux requêtes qui atteignent vos services Cloud Run déployés.

Quota Description Limite Augmentation possible Champ d'application
Requêtes de lecture de l'API Admin Cloud Run Nombre de lectures de l'API pour 60 secondes, par région. Il ne s'agit pas du nombre de requêtes de lecture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées. 3 000 pour 60 secondes Oui Par projet et par région
Requêtes d'écriture dans l'API Admin Cloud Run Nombre d'écritures dans l'API pour 60 secondes, par région. Il ne s'agit pas du nombre de requêtes d'écriture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées. 180 pour 60 secondes Oui Par projet et par région
Exécution de tâche Nombre maximal d'exécutions d'une tâche par période de 60 secondes et par région. 180 pour 60 secondes Oui Par projet et par région

Augmenter le quota

Les demandes d'ajustement de quotas Cloud sont soumises à un examen. Si votre demande nécessite un examen, vous recevrez un e-mail confirmant qu'elle a bien été transmise. Si vous avez besoin d'aide, répondez à l'e-mail. Après examen de votre demande, vous recevrez une notification par e-mail indiquant si votre demande a été approuvée. Vous pouvez demander un ajustement de quota à l'aide de la console Google Cloud , de l'API Cloud Quotas ou de Google Cloud CLI. Les instructions suivantes montrent comment demander une nouvelle valeur de quota à l'aide de la console Google Cloud ou en envoyant une requête REST à l'API Cloud Quotas.

Console

Pour demander un ajustement de quota, procédez comme suit :

  1. Dans la console Google Cloud , accédez à la page IAM et administration > Quotas et limites du système :

    Accéder à la page Quotas et limites du système

    Si vous êtes invité à sélectionner un projet, choisissez celui que vous souhaitez ajuster.

  2. Recherchez le quota que vous souhaitez ajuster, puis ouvrez la boîte de dialogue Modifications de quotas :

    • Quotas non inclus dans le tableau :

      • Recherchez votre quota dans le champ de recherche Filtre. Ne spécifiez pas la région ni la zone (le cas échéant), car les quotas qui n'ont pas de valeurs d'utilisation ou ajustées ne s'affichent pas dans le tableau.
      • Recherchez une entrée pour votre quota dans le tableau. Il peut s'agir de l'entrée par défaut ou de n'importe quelle entrée avec un historique, quelle que soit la région ou la zone.
      • Sur la ligne de l'entrée, cliquez sur Autres actions > Configurer des régions/zones supplémentaires.
      • Sélectionnez la région ou la zone que vous souhaitez ajuster. Cliquez sur Modifier.
    • Tous les autres quotas :

      • Recherchez votre quota dans le champ de recherche Filtre.
      • Sur la ligne de l'entrée, cochez la case correspondant à votre quota.
      • Cliquez sur Modifier ().

    La boîte de dialogue Modifications de quotas s'affiche.

  3. Si le lien Demander un quota supérieur s'affiche au-dessus du champ Nouvelle valeur et que vous souhaitez augmenter la valeur de votre quota au-delà du nombre indiqué à l'écran, cliquez sur le lien. Remplissez le formulaire, envoyez-le et ignorez les étapes restantes. Sinon, continuez à suivre ce guide.

  4. Dans le champ Nouvelle valeur, saisissez la valeur de quota que vous souhaitez obtenir. Si un champ Description de la demande s'affiche, saisissez une description. Cliquez sur OK.

    • Si une case à cocher contenant le texte "Je comprends que cette demande supprimera tous les remplacements" s'affiche, cela signifie que votre quota est inférieur à la valeur par défaut. Si vous ajustez la valeur du quota à la valeur par défaut ou au-delà, le remplacement est supprimé. Pour continuer, cochez la case. En savoir plus sur les quotas de remplacement

    Si un bouton Suivant s'affiche, cliquez sur Suivant, puis renseignez vos coordonnées sur l'écran suivant.

  5. Cliquez sur Envoyer la requête.

Si vous constatez que vous ne pouvez pas demander un ajustement dans la console, demandez l'augmentation auprès de Cloud Customer Care.

Pour en savoir plus sur le fonctionnement du processus d'augmentation des quotas, consultez À propos des ajustements de quotas.

Regrouper des demandes d'ajustement de quota

Vous pouvez regrouper des demandes d'ajustement de quota en cochant la case à côté de chaque quota que vous souhaitez inclure. Toutefois, le traitement par lot des demandes peut augmenter le délai nécessaire à Google Cloud pour examiner votre demande.

Pour réduire le temps d'examen, regroupez les demandes d'ajustement de quota par produit et par zone géographique. Par exemple, si vous souhaitez demander des ajustements pour les quotas de réseau et de VM Compute Engine, créez une requête pour les quotas de réseau et une autre pour les quotas de VM Compute Engine.

REST

Pour demander un ajustement de quota à partir de l'API Cloud Quotas, utilisez l'exemple de code suivant. Renseignez les espaces réservés modifiables avec vos valeurs. Pour en savoir plus sur les champs d'espace réservé, consultez les descriptions qui suivent l'exemple de code.

POST projects/PROJECT_NUMBER/locations/global/quotaPreferences?quotaPreferenceId=QUOTA_PREFERENCE_ID {
    "service": "SERVICE_ID",
    "quotaId": "QUOTA_ID",
    "quotaConfig": { "preferredValue": "NEW_QUOTA_VALUE" },
    "dimensions": { "DIMENSION_1": "VALUE_1", "DIMENSION_2": "VALUE_2" },
    "justification": "JUSTIFICATION",
    "contactEmail": "EMAIL"
}

Remplacez les éléments suivants :

  • PROJECT_NUMBER : numéro de votre projet Google Cloud . Vous pouvez trouver le numéro de votre projet sur la page Bienvenue de la console Google Cloud ou en exécutant la commande gcloud CLI suivante :

    PROJECT=$(gcloud info --format='value(config.project)')
    gcloud projects describe ${PROJECT} --format="value(projectNumber)"
  • QUOTA_PREFERENCE_ID : ID de la préférence de quota que vous mettez à jour.

  • QUOTA_ID : ID du quota que vous mettez à jour.

  • SERVICE_ID : ID du Google Cloud auquel appartient le quota que vous ajustez. Il s'agit généralement de SERVICE_NAME.googleapis.com. Par exemple, le nom du service Compute Engine est compute.googleapis.com.

  • DIMENSION_1 : type de dimension que vous souhaitez ajuster (par exemple, region ou zone). Vous pouvez inclure plusieurs dimensions. Séparez chaque dimension par une virgule après sa valeur (par exemple, VALUE_1). Pour ajuster toutes les dimensions du quota, omettez cette ligne.

  • VALUE_1 : valeur de la dimension précédente. Par exemple, si la dimension précédente est region, saisissez une région telle que us-central1.

  • JUSTIFICATION : motif de la requête.

  • EMAIL : adresse e-mail pouvant être utilisée comme contact, au cas où Google Cloud aurait besoin de plus d'informations pour prendre une décision avant d'accorder un quota supplémentaire.

Exemple de requête

Voici un exemple de demande d'augmentation de la valeur du quota PUS-PER-GPU-FAMILY-per-project-region de Compute Engine. Elle demande une valeur de quota de 100 pour les machines de la famille de GPU NVIDIA_H100 qui se trouvent dans la région us-central1.

POST projects/123/locations/global/quotaPreferences?quotaPreferenceId=my_quota_preference_ID {
    "service": "compute.googleapis.com",
    "quotaId": "GPUS-PER-GPU-FAMILY-per-project-region",
    "quotaConfig": { "preferredValue": 100 },
    "dimensions": { "region": "us-central1", "gpu_family": "NVIDIA_H100" },
    "justification": "My justification.",
    "contactEmail": "222larabrown@gmail.com"
}