Este documento lista as cotas e os limites do sistema que se aplicam ao Media CDN.
- As cotas têm valores definidos por padrão, mas geralmente é possível solicitar ajustes.
- Os limites do sistema são valores fixos que não podem ser alterados.
OGoogle Cloud usa cotas para garantir a distribuição justa e reduzir sobrecargas no uso e na disponibilidade dos recursos. Uma cota restringe a alocação de um recurso doGoogle Cloud para uso do seu projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de produtos e serviços do Google Cloud .
- Restringe o consumo desses recursos.
- Possibilita a solicitação de mudanças no valor das cotas e a automatização de ajustes de cotas.
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Saiba mais em Visão geral das cotas do Cloud.
Também há limites de sistema nos recursos do Media CDN. Os limites do sistema não podem ser alterados.
Cotas
As cotas a seguir se aplicam ao Media CDN. Se você precisar de uma cota maior, entre em contato com a Google Cloud equipe de vendas e solicite ajustes. Para mais informações, consulte Solicitar um ajuste de cota.
Configuração
| Item | Cota padrão |
|---|---|
Número máximo de recursos EdgeCacheService por projeto |
20 |
Número máximo de recursos EdgeCacheOrigin por projeto |
30 |
Número máximo de recursos EdgeCacheKeyset por projeto |
10 |
Limites do sistema
Os limites a seguir se aplicam ao Media CDN.
Configuração
| Item | Limites | Observações |
|---|---|---|
Número máximo de recursos RouteRules por EdgeCacheService |
200 | Cada |
Número máximo de recursos PathMatchers por EdgeCacheService |
50 | Cada |
| Número máximo de certificados SSL por serviço | 5 | Consulte a cota por projeto para certificados SSL. |
Número máximo de chaves públicas por EdgeCacheKeyset |
3 | Várias chaves em um conjunto de chaves permitem a rotação de chaves. Remova as chaves não usadas ao longo do tempo. |
Número máximo de chaves compartilhadas de validação por EdgeCacheKeyset |
3 | Várias chaves em um conjunto de chaves são projetadas para permitir a rotação de chaves: remova as chaves mais antigas e não usadas chaves ao longo do tempo. |
Cabeçalhos, solicitações e códigos de status HTTP
| Item | Limites | Observações |
|---|---|---|
| Tamanho máximo do cabeçalho da solicitação, incluindo o caminho da solicitação | 16 KiB | Esse limite não pode ser aumentado.
Dependendo do protocolo subjacente, a conexão de solicitação é
fechada sem que um código de resposta seja gravado ou a solicitação
é rejeitada com uma resposta HTTP
Essas solicitações são registradas com um |
| Tamanho máximo do corpo da solicitação | 16 KiB | Esse limite não pode ser aumentado.
As solicitações com um corpo acima desse limite são rejeitadas com um código de status HTTP
|
| Tamanho máximo do cabeçalho de resposta | Aproximadamente 128 KiB |
As respostas de origem com cabeçalhos que excedem esse limite resultam no envio de um código de status HTTP
|
| Tamanho máximo do objeto armazenável em cache | 100 GiB |
Esse é o tamanho máximo dos objetos na origem que Media CDN pode armazenar em cache. Objetos maiores são tratados como não armazenáveis em cache. |
| Tamanho máximo da resposta não armazenável em cache | 10239 MiB |
Esse é o número máximo de bytes em uma resposta (incluindo cabeçalhos) que o Media CDN proxy quando um objeto não é armazenável em cache. As respostas não armazenáveis em cache são truncadas depois de atingir o limite. |
| Conversão de cabeçalhos para minúsculas | Sempre, para o Media CDN | O Media CDN segue as convenções HTTP/2 para uso de maiúsculas e minúsculas nos cabeçalhos de solicitação e resposta.
Independente do protocolo usado, todos os cabeçalhos são convertidos para minúsculas.
Por exemplo, Os casos de valores de cabeçalho não são alterados. |
Limites de taxa de solicitação de API
Se você precisar de um limite de taxa maior para solicitações de API, revise o uso atual e solicite um aumento.
| Item | Limites |
|---|---|
Invalidações por EdgeCacheService |
10 por minuto |
Todas as chamadas que não estão no
networkservices namespace por projeto |
1.200 chamadas por minuto |
Somente leitura: GetEdgeCache*,
ListEdgeCache* por projeto |
100 por minuto |
Leitura/gravação: tudo no networkservices
namespace não marcado como somente leitura por projeto |
100 por minuto |
Recomendamos que as solicitações de atualização, como create, patch e delete, sejam enviadas uma de cada vez. Embora a API enfileire várias solicitações simultâneas, o envio dessas solicitações simultaneamente pode levar a um aumento significativo da latência e a tempos de processamento mais longos, já que o sistema processa cada item em série.
Tempos limite do cliente
| Tempo limite | Duração máxima | Código de status | Descrição |
|---|---|---|---|
| Maximum request duration | 5 minutos | HTTP 408 Request Timeout |
A duração máxima de uma única solicitação-resposta. |
| Header timeout | 10 segundos | HTTP 408 Request Timeout |
Quanto tempo o cliente tem para enviar o conjunto completo de cabeçalhos de solicitação. |
Tempos limite de origem
connectTimeoutemaxAttemptsTimeoutlimitam o tempo que o Media CDN leva para encontrar uma resposta utilizável.Ambos os tempos limite incluem o tempo que a origem leva para retornar cabeçalhos e para determinar se deve usar um failover ou redirecionamento.
connectTimeouté aplicado de forma independente para cada tentativa de origem, enquantomaxAttemptsTimeoutinclui o tempo necessário para se conectar em todas as tentativas de origem, incluindo failovers e redirecionamentos. Seguir um redirecionamento conta como uma tentativa adicional de conexão com a origem e conta para omaxAttemptsdefinido para a origem configurada.Quando o Media CDN encontra uma resposta não redirecionada, como de uma origem de redirecionamento ou origem do failover, os valores
readTimeouteresponseTimeoutsão aplicados. As origens redirecionadas usam os valoresconnectTimeout,readTimeout, eresponseTimeoutconfigurados para oEdgeCacheOriginque encontrou o redirecionamento.responseTimeoutereadTimeoutcontrolam quanto tempo uma resposta transmitida pode levar. Depois que o Media CDN determina que vai usar uma resposta upstream, nemconnectTimeoutnemmaxAttemptsTimeoutimportam. Nesse momento,readTimeouteresponseTimeoutentram em vigor.
O Media CDN faz no máximo quatro tentativas de origem em todas as origens, independente do maxAttempts definido por cada EdgeCacheOrigin.
O Media CDN usa o valor maxAttemptsTimeout da EdgeCacheOrigin principal. Os valores de tempo limite por tentativa (connectTimeout, readTimeout e responseTimeout) são configurados para o EdgeCacheOrigin de cada tentativa.
A tabela a seguir descreve os campos de tempo limite:
| Campo | Padrão | Descrição |
|---|---|---|
| connectTimeout | 5 segundos | O tempo máximo que o Media CDN pode levar desde
o início da solicitação até a origem até que o Media CDN determine
se a resposta é utilizável. Na prática, O tempo limite precisa ser um valor entre 1 e 15 segundos. |
| maxAttemptsTimeout | 15 segundos | O tempo máximo em todas as tentativas de conexão com a origem,
incluindo origens de failover, antes de retornar um erro ao cliente.
Um código de status HTTP O tempo limite precisa ser um valor entre 1 e 30 segundos. Essa configuração define a duração total de todas as tentativas de conexão de origem, incluindo origens de failover, para limitar o tempo total que os clientes precisam esperar para que o conteúdo comece a ser transmitido. Somente o primeiro
|
| readTimeout | 15 segundos | A duração máxima de espera entre leituras de uma única resposta HTTP.
O |
| responseTimeout | 30 segundos | A duração máxima para que uma resposta seja concluída. O tempo limite precisa ser um valor entre 1 e 120 segundos. A duração é medida a partir do momento em que os primeiros bytes do corpo são recebidos. Se esse tempo limite for atingido antes que a resposta seja concluída, a resposta será truncada e registrada. |
Gerenciar cotas
OMedia CDN aplica cotas no uso de recursos por vários motivos. Por exemplo, as cotas protegem a comunidade de usuários Google Cloud , impedindo picos de uso inesperados. As cotas também ajudam os usuários que estão explorando o Google Cloud com o nível gratuito a permanecer na avaliação.
Todos os projetos começam com as mesmas cotas, que podem ser alteradas com uma solicitação de cota extra. Algumas cotas podem aumentar automaticamente dependendo do uso de um produto.
Permissões
Para ver cotas ou solicitar aumentos de cotas, os membros do gerenciamento de identidade e acesso (IAM, na sigla em inglês) precisam ter um dos papéis a seguir:
| Tarefa | Papel necessário |
|---|---|
| Verificar cotas para um projeto | Uma das seguintes opções:
|
| Modificar cotas, solicitar cota extra | Uma das seguintes opções:
|
Verificar sua cota
Console
- No console Google Cloud , acesse a página Cotas.
- Para pesquisar a cota a ser atualizada, use a tabela de filtros. Se você não souber o nome da cota, use os links desta página.
gcloud
Com a Google Cloud CLI, execute o comando a seguir para
verificar suas cotas. Substitua PROJECT_ID pelo seu código do projeto:
gcloud compute project-info describe --project PROJECT_IDPara verificar a cota utilizada em uma região, execute o comando a seguir:
gcloud compute regions describe example-region
Erros ao exceder a cota
Se você exceder uma cota com um comando gcloud, o gcloud emitirá uma mensagem de erro quota exceeded e retornará com o código de saída 1.
Se você exceder uma cota com uma solicitação de API, Google Cloud vai retornar o
seguinte código de status HTTP: 413 Request Entity Too Large.
Solicitar cota adicional
Para ajustar a maioria das cotas, use o console Google Cloud . Para mais informações, consulte Solicitar um ajuste de cota.
Disponibilidade de recursos
Cada cota representa um número máximo para um tipo específico de recurso que é possível criar, desde que o recurso esteja disponível. É importante observar que as cotas não garantem a disponibilidade de recursos. Mesmo que você tenha cota disponível, não será possível criar um novo recurso se ele não estiver disponível.
Por exemplo, você pode ter cota suficiente para criar um novo endereço IP externo regional em uma determinada região. No entanto, isso não é possível se não houver endereços IP externos disponíveis naquela região. A disponibilidade de recursos zonais também pode afetar sua capacidade de criar um novo recurso.
São raras as situações em que os recursos não estão disponíveis em uma região inteira. No entanto, os recursos dentro de uma zona podem ser usados periodicamente, normalmente sem impacto no contrato de nível de serviço (SLA) para o tipo de recurso. Para mais informações, leia o SLA relevante do recurso.