Neste documento, listamos as cotas e os limites do sistema válidos para o Model Armor.
- As cotas têm valores definidos por padrão, mas geralmente é possível solicitar ajustes.
- Os limites do sistema são valores fixos que não podem ser alterados.
OGoogle Cloud usa cotas para garantir a distribuição justa e reduzir sobrecargas no uso e na disponibilidade dos recursos. Uma cota restringe a alocação de um recurso doGoogle Cloud para uso do seu projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de produtos e serviços do Google Cloud .
- Restringe o consumo desses recursos.
- Possibilita a solicitação de mudanças no valor das cotas e a automatização de ajustes de cotas.
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Saiba mais em Visão geral das cotas do Cloud.
Cotas da API Model Armor
A tabela a seguir especifica as cotas da API Model Armor.
| Quota | Valor |
|---|---|
| Consultas de API | 1.200 consultas por minuto (QPM) por projeto |
| Solicitações para ExternalProcessor | 600 QPM por projeto 1 |
É possível aplicar um valor entre 0 e 1.200 QPM por projeto. Para solicitar um ajuste, consulte Solicitar um ajuste de cota. Se você precisar de mais do que a cota padrão, entre em contato com o Cloud Customer Care.
Para informações sobre cotas relacionadas a integrações do Model Armor com outros serviços, consulte Gerenciar cota.
1 Relevante se você integrar o Model Armor a outros Google Cloud serviços.
Limite do sistema de tamanho de entrada
A tabela a seguir especifica o limite do sistema no tamanho do arquivo ou texto de entrada. O Model Armor ignora os arquivos ou textos que excedem esse limite.
| Limite do sistema | Valor |
|---|---|
| Todos os arquivos compatíveis e textos | 4 MB |
Limites de token do sistema
O Model Armor tem limites de sistema variáveis em tokens dependendo do filtro específico.
| Filtro | Limite do sistema |
|---|---|
| Detecção de injeção de comando e jailbreak | 10.000 |
| IA responsável | 10.000 |
| Material de abuso sexual infantil | 10.000 |
| Proteção de dados sensíveis | 130.000 |
Em relação aos limites de token, o comportamento do filtro é uniforme em todos os filtros. Se um filtro detectar uma correspondência, ele retornará MATCH_FOUND. Se um filtro não detectar uma correspondência, o valor retornado dependerá de a solicitação ou resposta exceder o limite de token do filtro:
- Se a solicitação ou resposta estiver dentro do limite de token do filtro, o filtro retornará
NO_MATCH_FOUND. - Se a solicitação ou resposta exceder o limite de token do filtro, o filtro retornará
EXECUTION_SKIPPED.
Receber nomes de métricas de cota e limite do sistema
As cotas e os limites do sistema têm dois tipos de nomes: nomes de exibição e nomes de métricas. Os nomes de exibição têm espaços e letras maiúsculas que facilitam a leitura para humanos. Os nomes de métricas geralmente são minúsculos e delimitados por sublinhados em vez de espaços. O formato exato depende do serviço.
As instruções a seguir mostram como receber nomes de métricas de cotas e limites do sistema usando o Google Cloud console ou a CLI gcloud.
Console
No Google Cloud console do, acesse a página IAM e administrador > Cotas e limites do sistema:
Acesse "Cotas e limites do sistema
A tabela nesta página mostra cotas e limites do sistema que têm uso ou valores ajustados, além de uma entrada de referência para outras cotas. A entrada de referência tem a palavra "default" entre parênteses no final das informações do produto na coluna Nome. Por exemplo,
SetIAMPolicy requests per minute per region (default)é a entrada de referência para a cotaSetIamPolicyRequestsPerMinutePerProject.Se a coluna Métrica não aparecer, siga estas etapas.
- Clique em Opções de exibição de coluna.
- Selecione Métrica.
- Clique em OK. A coluna Métrica aparece na tabela.
A coluna Métrica mostra os nomes das métricas. Para filtrar os resultados, insira um nome ou valor de propriedade no campo ao lado de Filtro.
gcloud
Para receber os nomes das métricas de um Google Cloud serviçousando a CLI gcloud, execute o quotas info list
comando. Para pular linhas que não listam nomes de métricas, transmita a saída para um
comando como grep com metric: como o termo de pesquisa ou use a
flag
--format da CLI gcloud:
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
Substitua:
PROJECT_ID_OR_NUMBER: o ID ou o número do projeto.SERVICE_NAME: o nome do serviço com as métricas de cota que você quer ver. Por exemplo, o nome do serviço do Compute Engine écompute.googleapis.com. Inclua a partegoogleapis.comdo nome do serviço.