En esta sección se explica cómo funciona el rendimiento aprovisionado en los modelos Veo 3 y posteriores, incluido el comportamiento de aplicación de cuotas y el incremento mínimo de compra de unidades de almacenamiento de Google.
En los modelos Veo 3, el periodo de cumplimiento de la cuota varía en función del número de GSUs que compres para el modelo y está sujeto a cambios. Los periodos de aplicación de cuotas para los diferentes tamaños de GSU son los siguientes:
De 1 a 9 GSUs: 2000 segundos
De 10 a 19 GSUs: 400 segundos
De 20 a 39 GSUs: 200 segundos
Entre 40 y 66 GSUs: 100 segundos
67 o más GSUs: 60 segundos
Ten en cuenta que esto no está relacionado con la latencia de las solicitudes. El tiempo que se tarda en procesar tu solicitud no es el mismo que el periodo de aplicación de la cuota.
Por ejemplo, si tienes una carga de trabajo que requiere generar un vídeo de cuatro segundos en el modelo Veo 3 y compras 1 GSU, puedes generar ese vídeo en unos minutos. Sin embargo, como el periodo de cumplimiento de 1 GSU es de 2000 segundos, no puedes generar un vídeo del mismo tamaño hasta que finalice ese periodo. Ten en cuenta que esto está sujeto a la hora del reloj de Vertex AI y no depende de la hora de tu solicitud. Te recomendamos que uses la herramienta de estimación de la página Rendimiento aprovisionado para calcular el número de unidades de almacenamiento de Google (GSUs) que necesita tu carga de trabajo. Para obtener más información sobre cómo usar la herramienta de estimación, consulta Comprar un pedido de capacidad de procesamiento aprovisionada. Estos amplios plazos de aplicación aseguran que tu solicitud se procese en un plazo específico. Si necesitas procesar resultados en Veo 3 con más frecuencia, debes comprar suficientes GSUs y consultar el periodo de cumplimiento correspondiente.