Questa sezione spiega come funziona il throughput di cui è stato eseguito il provisioning per i modelli Veo 3 e successivi, incluso il comportamento di applicazione della quota e l'incremento minimo di acquisto di GSU.
Per i modelli Veo 3, il periodo di applicazione della quota varia in base al numero di GSU acquistate per il modello ed è soggetto a modifiche. I periodi di applicazione delle quote per le diverse dimensioni di GSU sono i seguenti:
1-9 GSU: 2000 secondi
10-19 GSU: 400 secondi
20-39 GSU: 200 secondi
40-66 GSU: 100 secondi
67 o più GSU: 60 secondi
Tieni presente che questo non è correlato alla latenza della richiesta. Il tempo per elaborare la tua richiesta non è lo stesso del periodo di applicazione della quota.
Ad esempio, se hai un workload che richiede la generazione di un video di 4 secondi sul modello Veo 3 e acquisti 1 GSU, puoi generare il video in pochi minuti. Tuttavia, poiché la finestra di applicazione per 1 GSU è di 2000 secondi, non puoi generare un video delle stesse dimensioni fino alla fine di questo periodo. Tieni presente che questa operazione è soggetta all'ora di Vertex AI e non dipende dall'ora della richiesta. Ti consigliamo di utilizzare lo strumento di stima nella pagina Throughput di cui è stato eseguito il provisioning per stimare il numero di GSU richieste per il tuo carico di lavoro. Per saperne di più sull'utilizzo dello strumento di stima, consulta Acquistare un ordine di throughput riservato. Queste ampie finestre di applicazione garantiscono che la tua richiesta venga elaborata entro un periodo di tempo specifico. Se devi elaborare gli output su Veo 3 più spesso, devi acquistare GSU sufficienti e controllare la finestra di applicazione corrispondente.