Código de erro 429

Se o número de solicitações exceder a capacidade alocada para processar solicitações, o código de erro 429 será retornado. A tabela a seguir mostra a mensagem de erro gerada por cada tipo de framework de cota:

Framework de cota Mensagem
Pagamento por utilização Resource exhausted, please try again later.
Capacidade de processamento provisionada Too many requests. Exceeded the Provisioned Throughput.

Com uma assinatura de capacidade de processamento provisionada (PT), é possível reservar uma quantidade de capacidade para modelos específicos de IA generativa. Se você não tiver uma assinatura do PT e os recursos não estiverem disponíveis para seu aplicativo, um código de erro 429 será retornado. Mesmo que você não tenha capacidade reservada, tente fazer a solicitação de novo. No entanto, a solicitação não é contabilizada na sua taxa de erros, conforme descrito no contrato de nível de serviço (SLA).

Para projetos que compraram o PT, a plataforma de agentes do Gemini Enterprise mede a capacidade de processamento de um projeto e reserva a quantidade comprada para o uso real do projeto.

Para o PT padrão, quando você usa menos do que a quantidade comprada, erros que poderiam ser 429 são retornados como 5XX e contam para a taxa de erros do SLA. Para o PT de zona única, quando você usa menos do que a quantidade comprada, os erros 429 relacionados à capacidade são tratados como 5XX, mas não contam para a taxa de erros do SLA. Quando você excede a quantidade comprada, as solicitações adicionais são processadas sob demanda como pagamento por uso.

Pagamento por utilização

No framework de cota de pagamento por uso, você tem as seguintes opções para resolver erros de 429:

  • Use o endpoint global em vez de um regional sempre que possível.
  • Implemente uma estratégia de repetição usando espera exponencial truncada.
  • Se o modelo usar cotas, envie uma Solicitação de Aumento de Cota (QIR). Se o modelo usar o pagamento por uso padrão, suavizar o tráfego e reduzir picos grandes pode ajudar.
  • Assine o PT para ter um nível de serviço mais consistente. Para mais informações, consulte PT.

PT

Para corrigir o erro 429 gerado pela PT, faça o seguinte:

  • Use o exemplo de comportamento padrão, que não define um cabeçalho em solicitações de previsão. Os excedentes são processados sob demanda e faturados como pagamento por uso.
  • Aumente o número de GSUs na sua assinatura do PT.

A seguir