Capacidade de processamento provisionada para modelos do Veo 3

Esta seção explica como o throughput provisionado funciona para os modelos Veo 3 e mais recentes, incluindo o comportamento de aplicação de cota e o incremento mínimo de compra de GSU.

Para modelos do Veo 3, o período de aplicação de cotas varia de acordo com o número de GSUs compradas para o modelo e está sujeito a mudanças. Os períodos de aplicação de cota para diferentes tamanhos de GSU são os seguintes:

  • 1 a 9 GSUs: 2.000 segundos

  • 10 a 19 GSUs: 400 segundos

  • 20 a 39 GSUs: 200 segundos

  • 40 a 66 GSUs: 100 segundos

  • 67 ou mais GSUs: 60 segundos

Isso não está conectado à latência da solicitação. O tempo para processar sua solicitação não é o mesmo que o período de aplicação da cota.

Por exemplo, se você tiver uma carga de trabalho que exija a geração de um vídeo de quatro segundos no modelo Veo 3 e comprar uma GSU, poderá gerar esse vídeo em poucos minutos. No entanto, como o período de aplicação para 1 GSU é de 2.000 segundos, não é possível gerar um vídeo do mesmo tamanho até o fim desse período. Isso está sujeito ao tempo de relógio da Vertex AI e não depende do horário da sua solicitação. Recomendamos usar a ferramenta de estimativa na página "Taxa de transferência provisionada" para estimar o número de GSUs necessárias para sua carga de trabalho. Para mais informações sobre como usar a ferramenta de estimativa, consulte Comprar um pedido de capacidade de processamento provisionada. Essas grandes janelas de aplicação garantem que sua solicitação seja processada em um período específico. Se você precisar processar saídas no Veo 3 com mais frequência, compre GSUs suficientes e verifique a janela de aplicação correspondente.

A seguir