Ce document liste les quotas de débit et les limites du système Compute Engine qui spécifient le nombre de requêtes que vous pouvez envoyer aux méthodes de l'API Compute Engine.
Les quotas limitent la quantité d'une Google Cloud ressource que votre projet peut utiliser. Si vous souhaitez modifier la valeur de votre quota pour permettre une plus grande utilisation des ressources, vous pouvez demander un ajustement de quota. Les limites du système sont des contraintes fixes qui ne peuvent pas être augmentées ni diminuées. Pour en savoir plus, consultez la présentation des quotas Cloud overview.
Quotas de débit et limites du système
Les quotas de débit (également appelés quotas d'API) définissent le nombre de requêtes pouvant être envoyées à l'API Compute Engine. Ces quotas s'appliquent par projet. Chaque quota s'applique à un groupe d'une ou plusieurs méthodes de l'API Compute Engine. Lorsque vous utilisez gcloud CLI ou la Google Cloud console, vous envoyez également des requêtes à l'API, qui vont être comptabilisées dans votre quota de débit. Si vous utilisez des comptes de service pour accéder à l'API, ils sont également pris en compte dans votre quota de débit.
Google applique des quotas de débit en respectant un intervalle d'une minute pour chaque groupe. Si votre projet atteint le nombre maximal de requêtes API en 60 secondes, vous devez attendre que ce quota de débit soit réinitialisé avant d'envoyer d'autres requêtes dans ce groupe.
Par exemple, si un projet atteint une limite de quota à 10:00:15, le quota est réinitialisé au début de l'intervalle synchronisé suivant, par exemple à 10:01:00, plutôt que d'être réinitialisé immédiatement.
Si votre projet dépasse un quota de débit, vous recevez une erreur 403 associée au motif suivant : rateLimitExceeded. Pour résoudre cette erreur, attendez une minute, puis relancez votre requête. Le quota devrait être réinitialisé au début de l'intervalle suivant.
Le nombre de requêtes que vous pouvez envoyer à l'API Compute Engine est défini par des quotas d'API, comme décrit dans les tableaux suivants. Chaque groupe est comptabilisé séparément, ce qui vous permet d'atteindre simultanément le quota maximal dans chaque groupe.
Quotas de débit et limites du système pour les méthodes globales
Les sections suivantes listent les quotas qui définissent le nombre de requêtes que vous pouvez envoyer aux méthodes globales de l'API Compute Engine.
Quotas d'API et limites du système simplifiés pour les méthodes globales
Pour améliorer la détectabilité et la gérabilité des quotas de l'API Compute Engine, Google Cloud a réduit le nombre de métriques de quota en les regroupant dans un nombre plus restreint de quotas. Ces métriques de quota simplifiées offrent également des limites plus élevées pour chaque quota.
Le tableau suivant répertorie les quotas et les métriques d'API simplifiés pour l'API Compute Engine :
| Quota et description | Nom de la métrique |
|---|---|
Requêtes de lecture par minute (GlobalReadsPerMinutePerProject)Quota pour les méthodes get et list globales.
|
compute.googleapis.com/global_reads |
Requêtes d'écriture par minute (GlobalWritesPerMinutePerProject)Quota pour les méthodes d'écriture globales qui ne sont pas incluses dans d'autres métriques de quota. |
compute.googleapis.com/global_writes |
Requêtes d'invalidation du cache par minute (GlobalCacheInvalidationRequestsPerMinutePerProject)Quota pour les méthodes UrlMapsService.InvalidateCache globales.
|
compute.googleapis.com/global_cache_invalidation_requests |
Le tableau suivant répertorie les limites du système et les métriques pour l'API Compute Engine :
| Limite du système et description | Nom de la métrique |
|---|---|
Requêtes utilisables par minute (GlobalListUsablePerMinutePerProject)Limite du système pour les méthodes ListUsable globales.
|
compute.googleapis.com/list_usable_requests |
Frais généraux associés aux coûts catalogue filtrés (ListRequestsFilterCostOverheadPerMinutePerProject)Limite du système pour
Google Cloud facture l'utilisation du quota pour cette métrique en plus de
les quotas par rapport à
la métrique |
compute.googleapis.com/filtered_list_cost_overheadDébit par projet : 750 000 ressources filtrées dans les requêtes de liste par région et par minute. Étant donné que le quota est facturé toutes les 10 000 ressources, vous voyez la limite de 75 (750 000/10 000) lorsque vous demandez cette limite de quota dans la Google Cloud console. |
Requêtes par minute (GlobalRequestsPerMinutePerProject)Limite du système pour toutes les requêtes de lecture et d'écriture globales. |
compute.googleapis.com/global_requests |
Quotas d'API et limites du système hérités pour les méthodes globales
Le tableau suivant répertorie tous les quotas de l'API Compute Engine pour les méthodes globales.
| Quota et description | Nom de la métrique |
|---|---|
Requêtes par minute (defaultPerMinutePerProject)Quota pour les méthodes de liste et de mutation globales qui ne sont pas incluses dans d'autres métriques de quota. Les méthodes
|
compute.googleapis.com/default |
Requêtes de lecture (héritées) (ReadRequestsPerMinutePerProject)Quota pour les méthodes *.get globales. |
compute.googleapis.com/read_requests |
Requêtes de liste (ListRequestsPerMinutePerProject)Quota pour les méthodes *.list globales. |
compute.googleapis.com/list_requests |
Requêtes de lecture d'opération (OperationReadRequestsPerMinutePerProject)Quota pour globalOperations.get method. |
compute.googleapis.com/operation_read_requests |
Requêtes de mutation de ressources globales (GlobalResourceWriteRequestsPerMinutePerProject)Quota pour les méthodes images.delete, images.deprecate,
images.insert, images.setLabels, snapshots.delete,
snapshots.insert, snapshots.setLabels,
machineImages.insert et machineImages.delete. |
compute.googleapis.com/global_resource_write_requests |
Requêtes de mutation intensive (HeavyWeightWriteRequestsPerMinutePerProject)Quota pour les méthodes patch, delete,
et insert pour les ressources interconnects. |
compute.googleapis.com/heavy_weight_write_requests |
Requêtes de lecture intensive (HeavyWeightReadRequestsPerMinutePerProject)Quota pour les méthodes *.aggregatedList. |
compute.googleapis.com/heavy_weight_read_requests |
Les quotas suivants s'appliquent aux API globales avec des quotas par méthode :
| Quota et description | Nom de la métrique | Limite par défaut |
|---|---|---|
| Requêtes d'insertion de licence Quotas pour la méthode licenses.insert. |
compute.googleapis.com/license_insert_requests |
|
| Requêtes de métadonnées d'instance communes définies au niveau du projet Quota pour la méthode projects.setCommonInstanceMetadata. |
compute.googleapis.com/project_set_common_instance_metadata_requests |
Quota par projet (ProjectSetCommonInstanceMetadataRequestsPerMinutePerProject) : 36 requêtes/minute |
Quotas de débit et limites du système pour les méthodes régionales et zonales
Les sections suivantes listent tous les quotas qui s'appliquent aux méthodes qui utilisent des métriques régionales.
Quotas et limites d'API simplifiés pour les méthodes régionales et zonales
| Quota et description | Nom de la métrique |
|---|---|
Requêtes de lecture par minute et par région (ReadRequestsPerMinutePerProjectPerRegion)Quota pour les méthodes `get` et `list` régionales et zonales. |
compute.googleapis.com/reads_per_region |
Requêtes d'écriture par région (WritesPerMinutePerProjectPerRegion)Quota pour les méthodes d'écriture régionales et zonales qui ne sont pas incluses dans d'autres métriques de quota. |
compute.googleapis.com/writes_per_region |
Le tableau suivant répertorie les limites du système pour les méthodes régionales et zonales de l'API Compute Engine :
| Limite du système et description | Nom de la métrique |
|---|---|
Requêtes utilisables par région (ListUsablePerMinutePerProjectPerRegion)Limite du système pour les méthodes ListUsable régionales et zonales.
|
compute.googleapis.com/list_usable_requests_per_region |
| Frais généraux associés aux coûts catalogue filtrés par région Limite du système pour
Google Cloud facture l'utilisation du quota pour cette métrique en plus de
les quotas par rapport à
la métrique |
compute.googleapis.com/filtered_list_cost_overhead_per_regionDébit par projet ( ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion) :
750 000 ressources filtrées dans les requêtes de liste par région et par minute. Étant donné que le
quota est facturé toutes les 10 000 ressources, vous voyez la limite de 75 (750 000/10 000) lorsque vous
demandez cette limite de quota dans la Google Cloud console.
|
Requêtes par minute et par région (RequestsPerMinutePerProjectPerRegion)Limite du système pour toutes les requêtes de lecture et d'écriture régionales. |
compute.googleapis.com/requests_per_region |
Quotas d'API et limites du système hérités pour les méthodes régionales
Le tableau suivant répertorie tous les quotas de l'API Compute Engine pour les méthodes régionales et zonales.
| Quota et description | Nom de la métrique |
|---|---|
Requêtes (QueriesPerMinutePerRegion)Quota pour les méthodes régionales et zonales qui créent, modifient ou suppriment des ressources Compute Engine. Par exemple, instances.insert, disks.update, et
instances.delete méthodes.
Les méthodes
|
compute.googleapis.com/default_per_region |
Requêtes de lecture (héritées) (ReadRequestsPerMinutePerRegion)Quota pour les méthodes get régionales et zonales
telles que autoscalers.get, disks.get, instances.get,
et machineTypes.get. |
compute.googleapis.com/read_requests_per_region |
Requêtes de liste (ListRequestsPerMinutePerRegion)Quota pour les méthodes list régionales et zonales
telles que autoscalers.list, disks.list, instances.list,
et machineTypes.list. |
compute.googleapis.com/list_requests_per_region |
Requêtes de lecture d'opération (OperationReadRequestsPerMinutePerRegion)Quota pour regionOperations.get et
zoneOperations.get méthodes. |
compute.googleapis.com/operation_read_requests_per_region |
Requêtes de mutation de ressources globales par région (GlobalResourceWriteRequestsPerMinutePerProjectPerRegion)Quota pour disks.createSnapshot,
et regionDisks.createSnapshot méthodes. |
compute.googleapis.com/global_resource_write_requests_per_region |
Requêtes de sortie du port série d'une instance (GetSerialPortOutputRequestsPerMinutePerProjectPerRegion)Quota pour la méthode instances.getSerialPortOutput. |
compute.googleapis.com/get_serial_port_output_requests_per_region |
Requêtes de lecture intensive (HeavyWeightReadRequestsPerMinutePerRegion)Quota pour les méthodes regionOperations.wait,
zoneOperations.wait, et
regionNetworkFirewallPolicies.getEffectiveFirewalls. |
compute.googleapis.com/heavy_weight_read_requests_per_region |
Requêtes de mutation intensive par région HeavyWeightWriteRequestsPerMinutePerProjectPerRegionQuota pour les méthodes patch,
delete, et insert pour la ressource
interconnectAttachments et
pour la méthode networks.updatePeering. |
compute.googleapis.com/heavy_weight_write_requests_per_region |
Requêtes de simulation d'événement de maintenance d'une instance (SimulateMaintenanceEventRequestsPerMinutePerProjectPerRegion)Quota pour la méthode instances.simulateMaintenanceEvent. |
compute.googleapis.com/simulate_maintenance_event_requests_per_region |
Requêtes de liste de référents d'une instance InstanceListReferrersRequestsPerMinutePerProjectPerRegionQuota pour la méthode instances.listReferrers. |
compute.googleapis.com/instance_list_referrers_requests_per_region |
Requêtes d'écriture de point de terminaison du réseau NetworkEndpointWriteRequestsPerMinutePerProjectPerRegionQuota pour networkEndpointGroups.attachNetworkEndpoints
et networkEndpointGroups.detachNetworkEndpoints méthodes. |
compute.googleapis.com/network_endpoint_write_requests_per_region |
Requêtes de liste de points de terminaison du réseau (NetworkEndpointListRequestsPerMinutePerProjectPerRegion)Quota pour la méthode networkEndpointGroups.listNetworkEndpoints. |
compute.googleapis.com/network_endpoint_list_requests_per_region |
Requêtes d'écriture de point de terminaison du réseau régional (RegionalNetworkEndpointWriteRequestsPerMinutePerProjectPerRegion)Quota pour regionNetworkEndpointGroups.attachNetworkEndpoints
et regionNetworkEndpointGroups.detachNetworkEndpoints méthodes. |
compute.googleapis.com/regional_network_endpoint_write_requests_per_region |
Requêtes de liste de points de terminaison du réseau régional (RegionalNetworkEndpointListRequestsPerMinutePerProjectPerRegion)Quota pour la méthode regionNetworkEndpointGroups.listNetworkEndpoints. |
compute.googleapis.com/regional_network_endpoint_list_requests_per_region |
Le tableau suivant répertorie les limites du système héritées pour les méthodes régionales et zonales de l'API Compute Engine :
| Limite du système et description | Nom de la métrique |
|---|---|
| Frais généraux associés aux coûts catalogue filtrés Limite du système pour
Google Cloud facture l'utilisation du quota pour cette métrique en plus des
quotas par rapport aux
métriques |
compute.googleapis.com/filtered_list_cost_overhead_per_regionDébit par projet ( ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion) :
750 000 ressources filtrées dans les requêtes de liste par région et par minute. Étant donné que le
quota est facturé toutes les 10 000 ressources, vous voyez la limite de 75 (750 000/10 000) lorsque vous
demandez cette limite de quota dans la Google Cloud console.
|
Demander une augmentation des quotas de débit
Si vous avez besoin d'un quota plus élevé pour effectuer des requêtes API, vous pouvez demander une augmentation du quota d'API à partir de la Google Cloud console. Pour plus d'instructions, consultez la section Demander un ajustement de quota.
Bonnes pratiques
Suivez les bonnes pratiques de l'API Compute Engine pour maîtriser votre consommation des quotas de débit, afin de limiter les effets s'y rapportant.
Étapes suivantes
- Découvrez comment surveiller l'utilisation des API.
- Découvrez comment configurer des alertes de quotas.