Panoramica del throughput riservato

Questa pagina spiega cos'è il throughput riservato e quando utilizzarlo.

Introduzione al throughput riservato

Il throughput riservato è un abbonamento a costo fisso e durata fissa disponibile in diverse durate che riserva il throughput per i modelli di AI generativa supportati su Gemini Enterprise Agent Platform. Per riservare il throughput, devi specificare il modello e le località disponibili in cui viene eseguito il modello.

Quando utilizzare il throughput riservato

Se una delle seguenti considerazioni si applica al tuo caso d'uso, valuta la possibilità di utilizzare il throughput riservato:

  • Stai creando applicazioni di produzione di AI generativa in tempo reale, come chatbot e agenti.
  • I tuoi workload critici richiedono costantemente un throughput elevato. La misurazione del throughput dipende dal modello.
  • Vuoi offrire un'esperienza coerente e prevedibile agli utenti delle tue applicazioni.
  • Vuoi costi di AI generativa deterministici pagando un prezzo fisso mensile o settimanale con il controllo dei costi aggiuntivi.

Il throughput riservato è uno dei diversi modi per utilizzare i modelli di AI generativa. Per scoprire tutte le opzioni di utilizzo, consulta Opzioni di utilizzo.

Passaggi successivi