Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Quota di velocità effettiva

Gemini Enterprise Agent Platform offre diversi modi per gestire il throughput per i modelli di AI generativa, in modo da bilanciare costi e prestazioni. Questo documento descrive le opzioni disponibili: un modello flessibile con pagamento a consumo e capacità riservata per un throughput prevedibile.

Quote per i modelli gestiti

Agent Platform offre due modi per gestire il throughput per i modelli di AI generativa gestiti su Gemini Enterprise Agent Platform, che ti consentono di bilanciare costi, flessibilità e prestazioni. Puoi utilizzare un modello con pagamento a consumo o riservare una quantità di throughput dedicata a un prezzo fisso.

Pay-as-you-go

Per il modello predefinito con pagamento a consumo, Agent Platform utilizza il pagamento a consumo standard. Il pagamento a consumo ti consente di pagare solo le risorse che utilizzi, senza richiedere impegni finanziari iniziali. Sono disponibili altre opzioni di pagamento a consumo con costi e prestazioni diversi. Per ulteriori informazioni, consulta Pagamento a consumo con priorità o Pagamento a consumo flessibile.

Capacità riservata

Per le applicazioni di produzione critiche che richiedono prestazioni coerenti e costi prevedibili, puoi utilizzare il throughput riservato. Il throughput riservato è un abbonamento a costo fisso che riserva una quantità specifica di throughput per i tuoi modelli in una località scelta.

Quote per i servizi di AI generativa

Gemini Enterprise Agent Platform offre una suite di servizi di AI generativa, come l'ottimizzazione dei modelli, la valutazione dei modelli, le previsioni in batch, gli incorporamenti e la generazione aumentata dal recupero. Per scoprire di più sulle quote per questi servizi, consulta Quote e limiti di sistema per l'AI generativa su Gemini Enterprise Agent Platform.

Passaggi successivi

Scopri di più sul pagamento a consumo standard.
Scopri di più sul throughput riservato.
Scopri di più sulle quote e sui limiti di sistema per l'AI generativa.
Scopri di più sulle quote di Google Cloud.

Quota di velocità effettiva Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.