Google utilizza la tecnologia AI per tradurre i contenuti nella tua lingua preferita. Le traduzioni generate dall'AI potrebbero contenere errori.

Panoramica del throughput riservato

Questa pagina spiega cos'è il throughput riservato e quando utilizzarlo.

Introduzione al throughput riservato

Il throughput riservato è un abbonamento a costo fisso e durata fissa disponibile in diverse durate che riserva il throughput per i modelli di AI generativa supportati su Gemini Enterprise Agent Platform. Per riservare il throughput, devi specificare il modello e le località disponibili in cui viene eseguito il modello.

Quando utilizzare il throughput riservato

Se il tuo caso d'uso rientra in una delle seguenti considerazioni, valuta la possibilità di utilizzare il throughput riservato:

Stai creando applicazioni di produzione di AI generativa in tempo reale, come chatbot e agenti.
I tuoi workload critici richiedono costantemente un throughput elevato. La misurazione del throughput dipende dal modello.
Vuoi offrire un'esperienza coerente e prevedibile agli utenti delle tue applicazioni.
Vuoi costi di AI generativa deterministici pagando un prezzo fisso mensile o settimanale con il controllo dei costi aggiuntivi.

Il throughput riservato è uno dei diversi modi per utilizzare i modelli di AI generativa. Per scoprire tutte le opzioni di utilizzo, consulta Opzioni di utilizzo.

Passaggi successivi

Modelli supportati che utilizzano il throughput riservato.

Panoramica del throughput riservato Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Introduzione al throughput riservato

Quando utilizzare il throughput riservato

Passaggi successivi

Panoramica del throughput riservato