Quota di velocità effettiva

Gemini Enterprise Agent Platform offre diversi modi per gestire il throughput per i modelli di AI generativa, in modo da bilanciare costi e prestazioni. Questo documento descrive le opzioni disponibili: un modello flessibile con pagamento a consumo e capacità riservata per un throughput prevedibile.

Quote per i modelli gestiti

Agent Platform offre due modi per gestire il throughput per i modelli di AI generativa gestiti su Gemini Enterprise Agent Platform, che ti consentono di bilanciare costi, flessibilità e prestazioni. Puoi utilizzare un modello con pagamento a consumo o riservare una quantità di throughput dedicata a un prezzo fisso.

Pay-as-you-go

Per il modello predefinito con pagamento a consumo, Agent Platform utilizza il pagamento a consumo standard. Il pagamento a consumo ti consente di pagare solo le risorse che utilizzi, senza richiedere impegni finanziari iniziali. Sono disponibili altre opzioni di pagamento a consumo con costi e prestazioni diversi. Per ulteriori informazioni, consulta Pagamento a consumo con priorità o Pagamento a consumo flessibile.

Capacità riservata

Per le applicazioni di produzione critiche che richiedono prestazioni coerenti e costi prevedibili, puoi utilizzare il throughput riservato. Il throughput riservato è un abbonamento a costo fisso che riserva una quantità specifica di throughput per i tuoi modelli in una località scelta.

Quote per i servizi di AI generativa

Gemini Enterprise Agent Platform offre una suite di servizi di AI generativa, come l'ottimizzazione dei modelli, la valutazione dei modelli, le previsioni in batch, gli incorporamenti e la generazione aumentata dal recupero. Per scoprire di più sulle quote per questi servizi, consulta Quote e limiti di sistema per l'AI generativa su Gemini Enterprise Agent Platform.

Passaggi successivi