Cotas e limites

Este documento lista as cotas e os limites do sistema que se aplicam ao Gemini para Google Cloud.

  • As cotas têm valores definidos por padrão, mas geralmente é possível solicitar ajustes.
  • Os limites do sistema são valores fixos que não podem ser alterados.

OGoogle Cloud usa cotas para garantir a distribuição justa e reduzir sobrecargas no uso e na disponibilidade dos recursos. Uma cota restringe a alocação de um recurso doGoogle Cloud para uso do seu projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .

O sistema de cotas do Cloud faz o seguinte:

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.

As cotas geralmente se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.

Saiba mais em Visão geral das cotas do Cloud.

Também há limites de sistemas nos recursos do Gemini. Não é possível alterar esses limites.

Solicitações por segundo

O Gemini para Google Cloud impõe cotas de solicitações por segundo para cada usuário em um projeto.

Cota Valor
Solicitações por segundo 2

Solicitações por dia

O Gemini para Google Cloud impõe cotas para o número total de solicitações por dia para cada usuário em um projeto.

Cota Valor
Solicitações por dia para o Gemini Code Assist ou o Gemini no BigQuery, como geração e conclusão de código. 6000
Solicitações por dia para chat, visualização, verificações de tabelas de insights de dados, geração de metadados, preparação de dados e outras solicitações que mostram respostas no painel Cloud Assist no console e nos ambientes de desenvolvimento do Google Cloud . 960

Cotas do Gemini Code Assist

O Gemini Code Assist impõe cotas para alguns recursos.

Cota Valor
Reconhecimento da base de código local Janela de contexto com 1 milhão de tokens
Repositórios de personalização de código 20.000

Cotas para o modo Agente e a CLI do Gemini

As cotas para solicitações do modo Agente do Gemini Code Assist e da CLI do Gemini são combinadas. No modo Agente ou ao usar a CLI do Gemini, um comando pode resultar em várias solicitações de modelo. As solicitações são limitadas por usuário por minuto e estão sujeitas à disponibilidade do serviço em momentos de alta demanda.

Quota Edição do Gemini Code Assist Valor
Número máximo de solicitações por usuário por dia Padrão 1500
Enterprise 2000

Cotas do Gemini Code Assist no GitHub

O uso do Gemini Code Assist no GitHub não é contabilizado como parte das cotas gerais do Gemini Code Assist.

  • Uma instalação da versão para consumidor do app Gemini Code Assist no GitHub tem uma cota de 33 revisões de solicitação de envio por dia.

  • Uma instalação da versão empresarial do app Gemini Code Assist no GitHub (prévia) tem uma cota de pelo menos 100 revisões de solicitação de envio por dia.

    • O número exato de revisões de solicitação de envio depende da base de código e de quantas chamadas de modelo são necessárias para concluir cada revisão de código. Por isso, em alguns casos, a cota pode ser significativamente maior que 100.

As cotas do Gemini Code Assist no GitHub são redefinidas em alinhamento com as redefinições de Google Cloud cotas.

Gemini no BigQuery

Para informações sobre os limites do Gemini no BigQuery, consulte Cotas e limites do BigQuery .

Solicitar aumento de cota

Para ajustar a maioria das cotas, use o console do Google Cloud . Para mais informações, consulte Solicitar ajuste de cota.