Panoramica del throughput riservato
Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questa pagina spiega cos'è il throughput di cui è stato eseguito il provisioning e quando utilizzarlo.
Introduzione al throughput riservato
Il Throughput riservato è un abbonamento a costo fisso e durata fissa
disponibile in diverse durate che riserva il throughput per
i modelli di AI generativa supportati su Vertex AI.
Per prenotare la velocità effettiva, devi specificare il modello e le posizioni disponibili in cui viene eseguito.
Quando utilizzare il throughput riservato
Se uno dei seguenti aspetti si applica al tuo caso d'uso, valuta la possibilità di utilizzare
il throughput di cui è stato eseguito il provisioning:
Stai creando applicazioni di produzione di AI generativa in tempo reale, come
chatbot e agenti.
I tuoi workload critici richiedono costantemente una velocità effettiva elevata. La misurazione
del throughput dipende dal modello.
Vuoi offrire un'esperienza coerente e prevedibile agli utenti delle tue
applicazioni.
Vuoi costi deterministici dell'AI generativa pagando un prezzo mensile o settimanale fisso con controllo dei costi aggiuntivi.
Il Throughput riservato è uno dei diversi modi per utilizzare i modelli di AI generativa. Per scoprire di più su tutte le opzioni di consumo, consulta la sezione Opzioni di consumo.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2026-05-17 UTC."],[],[]]