Quotas e limites do sistema

Este documento lista as quotas e os limites do sistema que se aplicam ao Gemini Enterprise.

  • As quotas têm valores predefinidos, mas normalmente pode pedir ajustes.
  • Os limites do sistema são valores fixos que não podem ser alterados.

Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.

O sistema Cloud Quotas faz o seguinte:

Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.

Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.

Também existem limites do sistema nos recursos do Gemini Enterprise. Não é possível alterar os limites do sistema.

Para ver informações sobre os preços de excedentes do Gemini Enterprise, consulte o artigo Quotas e excedentes.

Quotas de atribuição

A tabela seguinte lista as quotas da API Discovery Engine. Estas quotas não são repostas ao longo do tempo. Em alternativa, são libertados quando liberta o recurso. Pode pedir um aumento da quota se a quota predefinida não for suficiente.

Quota Valor
Número total de armazéns de dados por projeto 100*
Número total de motores por projeto 150
Número de operações de longa duração de importação pendentes por projeto 300
Número de operações de longa duração de documentos de eliminação pendentes por projeto 100
Número de controlos de publicação por projeto 1000
Número de controlos de publicação de aumentos por configuração de publicação 100
Número de controlos de publicação de filtros por configuração de publicação 100
Número de controlos de publicação de redirecionamentos por configuração de publicação 100
Número de controlos de publicação de sinónimos por configuração de publicação 100
Número regional de armazenamentos de dados por projeto por localização (global, EUA, UE) 100
Número regional de documentos por projeto por localização (global, EUA, UE) 10 000 000
Número regional de motores por projeto por localização (global, EUA, UE) 150
Número regional de eventos de utilizador por projeto por localização (global, EUA, UE) 40 000 000 000

* Devido a uma limitação técnica, a quota máxima para armazenamentos de dados é de 500 por projeto. Se precisar de mais armazenamentos de dados, use novos projetos.

Devido a uma limitação técnica, a quota máxima para motores é de 500 por projeto. Se precisar de mais motores, use novos projetos.

Quotas de tarifas

As seguintes quotas aplicam-se aos pedidos da API Discovery Engine. Se a quota predefinida não for suficiente, pode pedir um aumento da quota.

Quota Valor
Pedidos de consultas concluídos por minuto por projeto 300
Pedidos de leitura de pesquisa conversacional por minuto por projeto 300
Pedidos de gravação de pesquisa conversacional por minuto por projeto 300
Pedidos em lote de documentos (como importação inline e eliminação) por minuto por projeto 100
Documente pedidos de importação assíncrona (Cloud Storage, BigQuery, etc.) por minuto por projeto 5
Pedidos de eliminação de documentos por minuto por projeto 100
Pedidos de leitura de documentos por minuto por projeto 300
Pedidos de gravação de documentos por minuto por projeto 12 000
Pedidos de criação de avaliação por dia e por projeto 5
Pedidos de leitura de avaliação por minuto por projeto 100
Pedidos de gravação de avaliação por minuto por projeto 100
Verificação de fundamentação da geração fundamentada de pedidos por minuto por projeto 300
Pedidos de consultas de MDIs (resumo de pesquisas, pesquisas com várias interações) por minuto por projeto 60
Número de escritas pendentes de FHIR ou streaming do BigQuery por minuto 6000
Número de conjuntos de consultas de exemplo por projeto 100
Pedidos da API Ranking por minuto por projeto 500
Recomendações de pedidos por minuto por projeto 60 000
Exemplo de pedidos de leitura de consultas por minuto por projeto 200
Exemplo de pedidos de leitura de conjuntos de consultas por minuto por projeto 100
Exemplo de pedidos de gravação de conjuntos de consultas por minuto por projeto 100
Exemplo de pedidos de gravação de consultas por minuto por projeto 200
Pedidos de leitura de esquemas por minuto por projeto 100
Pedidos de gravação de esquemas por minuto por projeto 100
Pedidos de pesquisa regionais por minuto por projeto por localização (global, EUA, UE) 300
Pedidos em lote de eventos do utilizador (como importação e eliminação) por minuto por projeto 100
Pedidos de recolha de eventos de utilizador por minuto por projeto por utilizador 240
Pedidos de gravação de eventos do utilizador por minuto por projeto 60 000

Peça um aumento da quota

Para ajustar a maioria das quotas, use a Google Cloud consola. Para mais informações, consulte o artigo Peça um ajuste da quota.