Este documento lista as cotas e os limites do sistema que se aplicam ao Gemini Enterprise.
- As cotas têm valores padrão, mas geralmente é possível solicitar ajustes.
- Os limites do sistema são valores fixos que não podem ser alterados.
OGoogle Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe a alocação de um recurso doGoogle Cloud para uso do seu projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de produtos e serviços do Google Cloud .
- Restringe o consumo desses recursos.
- Possibilita a solicitação de mudanças no valor das cotas e a automatização de ajustes de cotas.
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.
Também há limites de sistemas nos recursos do Gemini Enterprise. Os limites do sistema não podem ser alterados.
Para informações sobre preços de excedente do Gemini Enterprise, consulte Cotas e excedentes.
cotas de alocação.
A tabela a seguir lista as cotas da API Discovery Engine. Elas não são redefinidas com o tempo. Em vez disso, elas são liberadas quando você libera o recurso. Se a cota padrão não for suficiente, solicite um aumento.
Cota | Valor |
---|---|
Número total de repositórios de dados por projeto | 100* |
Número total de mecanismos por projeto | 150† |
Número de operações pendentes de longa duração para importação por projeto | 300 |
Número de operações de longa duração pendentes de exclusão de documentos por projeto | 100 |
Número de controles de veiculação por projeto | 1.000 |
Número de controles de exibição de reforço por configuração de exibição | 100 |
Número de controles de exibição de filtros por configuração de exibição | 100 |
Número de controles de exibição de redirecionamento por configuração de exibição | 100 |
Número de controles de veiculação de sinônimos por configuração de veiculação | 100 |
Número regional de repositórios de dados por projeto e local (global, EUA, UE) | 100 |
Número regional de documentos por projeto e local (global, EUA, UE) | 10.000.000 |
Número regional de mecanismos por projeto por local (global, EUA, UE) | 150 |
Número regional de eventos do usuário por projeto e local (global, EUA, UE) | 40.000.000.000 |
* Devido a uma limitação técnica, a cota máxima para repositórios de dados é de 500 por projeto. Se você precisar de mais repositórios de dados, use novos projetos.
† Devido a uma limitação técnica, a cota máxima para mecanismos é de 500 por projeto. Se você precisar de mais mecanismos, use novos projetos.
cotas de taxa.
As cotas a seguir se aplicam às solicitações da API Discovery Engine. Se a cota padrão não for suficiente, solicite um aumento.
Cota | Valor |
---|---|
Solicitações de consulta completa por minuto por projeto | 300 |
Solicitações de leitura de pesquisa por conversa por minuto por projeto | 300 |
Solicitações de gravação de pesquisa por conversa por minuto por projeto | 300 |
Solicitações em lote de documentos (como importação e remoção inline) por minuto e projeto | 100 |
Documentar solicitações de importação assíncrona (Cloud Storage, BigQuery etc.) por minuto por projeto | 5 |
Solicitações de exclusão de documentos por minuto por projeto | 100 |
Solicitações de leitura de documentos por minuto por projeto | 300 |
Solicitações de gravação de documentos por minuto e por projeto | 12.000 |
Solicitações de criação de avaliação por dia e por projeto | 5 |
Solicitações de leitura de avaliação por minuto por projeto | 100 |
Solicitações de gravação de avaliação por minuto por projeto | 100 |
Verificação de geração embasada por minuto por projeto | 300 |
Consultas de LLM (resumo da pesquisa, pesquisa em várias etapas) por minuto por projeto | 60 |
Número de gravações pendentes de streaming do FHIR ou do BigQuery por minuto | 6.000 |
Número de conjuntos de consultas de amostra por projeto | 100 |
Solicitações da API Ranking por minuto e projeto | 500 |
Solicitações de recomendação por minuto por projeto | 60.000 |
Exemplo de solicitações de leitura de consultas por minuto por projeto | 200 |
Exemplo de solicitações de leitura de conjunto de consultas por minuto por projeto | 100 |
Exemplo de solicitações de gravação de conjunto de consultas por minuto por projeto | 100 |
Exemplo de solicitações de gravação de consultas por minuto por projeto | 200 |
Solicitações de leitura de esquema por minuto por projeto | 100 |
Solicitações de gravação de esquema por minuto por projeto | 100 |
Solicitações regionais de pesquisa por minuto, por projeto e por local (global, EUA, UE) | 300 |
Solicitações em lote de eventos do usuário (como importação e exclusão) por minuto e por projeto | 100 |
Solicitações de coleta de eventos do usuário por minuto, projeto e usuário | 240 |
Solicitações de gravação de eventos do usuário por minuto e por projeto | 60.000 |
Solicitar aumento de cota
Para ajustar a maioria das cotas, use o console do Google Cloud . Para mais informações, consulte Solicitar ajuste de cota.