Este documento lista as quotas e os limites do sistema aplicáveis ao Model Armor.
- As quotas têm valores predefinidos, mas normalmente pode pedir ajustes.
- Os limites do sistema são valores fixos que não podem ser alterados.
Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.
O sistema Cloud Quotas faz o seguinte:
- Monitoriza o seu consumo de Google Cloud produtos e serviços
- Restringe o seu consumo desses recursos
- Oferece uma forma de pedir alterações ao valor da quota e automatizar os ajustes da quota
Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.
Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.
Para mais informações, consulte a vista geral das quotas da nuvem.
Quota de consultas da API
Pode aumentar esta quota na Google Cloud consola, de forma semelhante a outros Google Cloud serviços.
| Quota | Valor |
|---|---|
| Consultas de API | 1200 consultas por minuto (QPM) por projeto |
Limite do sistema de tamanho de entrada
A tabela seguinte especifica o limite do sistema no tamanho do ficheiro ou texto de entrada.
| Limite do sistema | Valor |
|---|---|
| Todos os ficheiros suportados e texto | 4 MB |
Limites do sistema de tokens
O Model Armor tem limites de sistema variáveis em tokens, dependendo do filtro específico.
| Filtro | Limite do sistema |
|---|---|
| Deteção de injeção de comandos e jailbreak | 10 000 |
| IA responsável | 10 000 |
| Material relativo a abuso sexual infantil | 10 000 |
| Proteção de dados confidenciais | 130 000 |
Quando o pedido ou a resposta excede o limite de tokens, o filtro de proteção de dados confidenciais devolve EXECUTION_SKIPPED. Todos os outros filtros, se o comando ou a resposta excederem o limite de tokens, devolvem MATCH_FOUND se for encontrado conteúdo malicioso nos primeiros 10 000 tokens ou EXECUTION_SKIPPED se não for encontrado conteúdo malicioso nos primeiros 10 000 tokens.
Obtenha nomes de métricas de quotas e limites do sistema
As quotas e os limites do sistema têm dois tipos de nomes: nomes a apresentar e nomes das métricas. Os nomes a apresentar têm espaços e letras maiúsculas que facilitam a leitura por parte dos humanos. É mais provável que os nomes das métricas estejam em minúsculas e delimitados por sublinhados em vez de espaços. O formato exato depende do serviço.
As instruções seguintes mostram como obter nomes de métricas para quotas e limites do sistema através da Google Cloud consola ou da CLI gcloud.
Consola
Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:
Aceda a Quotas e limites do sistema
A tabela nesta página apresenta as quotas e os limites do sistema que têm utilização ou têm valores ajustados, e uma entrada de referência para outras quotas. A entrada de referência tem a palavra "default" entre parênteses no final da ficha na coluna Nome. Por exemplo,
SetIAMPolicy requests per minute per region (default)é a entrada de referência para a quotaSetIamPolicyRequestsPerMinutePerProject.Se não vir a coluna Métrica, siga estes passos.
- Clique em Opções de apresentação de colunas.
- Selecione Métrica.
- Clique em OK. A coluna Métrica é apresentada na tabela.
A coluna Métrica mostra os nomes das métricas. Para filtrar os resultados, introduza um nome ou um valor de propriedade no campo junto a Filtrar.
gcloud
Para obter os nomes das métricas de um Google Cloud serviço através da CLI gcloud, execute o comando quotas info list. Para ignorar linhas que não indicam nomes de métricas, transmita o resultado para um comando como grep com metric: como termo de pesquisa ou use a flag --format da CLI gcloud:
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
Substitua o seguinte:
PROJECT_ID_OR_NUMBER: o ID do projeto ou o número do projeto.SERVICE_NAME: o nome do serviço cujas métricas de quota quer ver. Por exemplo, o nome do serviço para o Compute Engine écompute.googleapis.com. Inclua a partegoogleapis.comdo nome do serviço.
Peça um ajuste de quota
Para ajustar a maioria das quotas, use a Google Cloud consola. Para mais informações, consulte o artigo Peça um ajuste da quota.