Se o número de solicitações exceder a capacidade alocada para processar
solicitações, o código de erro 429 será retornado. A tabela a seguir mostra a mensagem de erro gerada por cada tipo de framework de cota:
| Estrutura de cota | Mensagem |
|---|---|
| Pagamento por uso | Resource exhausted, please try again later. |
| Capacidade de processamento provisionada | Too many requests. Exceeded the Provisioned Throughput. |
Com uma assinatura de capacidade de processamento provisionada (PT), é possível reservar uma
quantidade de capacidade para modelos específicos de IA generativa. Se você não tiver uma assinatura do
PT e os recursos não estiverem disponíveis
para seu aplicativo, um código de erro 429 será retornado. Embora você não tenha capacidade reservada, tente fazer a solicitação de novo. No entanto, a solicitação não é contabilizada na sua taxa de erros, conforme descrito no contrato de nível de serviço (SLA).
Para projetos que compraram o PT, a Gemini Enterprise Agent Platform mede a capacidade de processamento de um projeto e reserva a quantidade comprada para o uso real do projeto.
Para o PT padrão, quando você usa menos do que o valor comprado, erros que poderiam ser 429 são retornados como 5XX e contam para a taxa de erros do SLA. Para o PT de zona única, quando você usa menos do que o valor comprado, erros 429 relacionados à capacidade são tratados como 5XX, mas não contam para a taxa de erros do SLA. Quando você excede o valor comprado, as solicitações adicionais são processadas on demand como pagamento por uso.
Pagamento por uso
No framework de cota de pagamento por uso, você tem as seguintes opções para resolver erros de 429:
- Use o endpoint global em vez de um regional sempre que possível.
- Implemente uma estratégia de repetição usando espera exponencial truncada.
- Se o modelo usar cotas, envie uma Solicitação de Aumento de Cota (QIR). Se o modelo usar o pagamento por uso padrão, suavizar o tráfego e reduzir picos grandes pode ajudar.
- Assine o PT para ter um nível de serviço mais consistente. Para mais informações, consulte PT.
PT
Para corrigir o erro 429 gerado pela PT, faça o seguinte:
- Use o exemplo de comportamento padrão, que não define um cabeçalho em solicitações de previsão. Os excedentes são processados sob demanda e faturados como pagamento por uso.
- Aumente o número de GSUs na sua assinatura do PT.
A seguir
- Para saber mais sobre o pagamento por uso padrão, consulte Pagamento por uso padrão.
- Para saber mais sobre a capacidade de processamento provisionada, consulte Capacidade de Processamento Provisionada.
- Para saber mais sobre cotas e limites do Agent Platform, consulte Cotas e limites do Agent Platform.
- Para saber mais sobre cotas e limites do sistema, consulte a documentação sobre as cotas do Cloud. Google Cloud