Gemini Enterprise Agent Platform proporciona diferentes formas de administrar la capacidad de procesamiento para los modelos de IA generativa para ayudarte a equilibrar el costo y el rendimiento. En este documento, se describen las opciones disponibles: un modelo flexible de pago por uso y capacidad reservada para una capacidad de procesamiento predecible.
Cuotas de modelos administrados
Agent Platform ofrece dos formas de administrar la capacidad de procesamiento para los modelos de IA generativa administrados en Gemini Enterprise Agent Platform, lo que te permite equilibrar el costo, la flexibilidad y el rendimiento. Puedes usar un modelo de pago por uso o reservar una cantidad dedicada de capacidad de procesamiento por un precio fijo.
Pay-as-you-go
Para el modelo predeterminado de pago por uso, Agent Platform usa el pago por uso estándar (Standard PayGo). PayGo te permite pagar solo por los recursos que consumes, sin necesidad de compromisos financieros por adelantado. Existen opciones adicionales de PayGo que varían en costo y rendimiento. Para obtener más información, consulta Priority PayGo o Flex PayGo.
Capacidad reservada
Para las aplicaciones de producción críticas que requieren un rendimiento coherente y costos predecibles, puedes usar la capacidad de procesamiento aprovisionada. La capacidad de procesamiento aprovisionada es una suscripción de costo fijo que reserva una cantidad específica de capacidad de procesamiento para tus modelos en una ubicación elegida.
Cuotas para los servicios de IA generativa
Gemini Enterprise Agent Platform ofrece un conjunto de servicios de IA generativa, como el ajuste de modelos, la evaluación de modelos, la predicción por lotes, las incorporaciones y la generación mejorada por recuperación. Para obtener más información sobre las cuotas de estos servicios, consulta Cuotas y límites del sistema de IA generativa en Gemini Enterprise Agent Platform.
¿Qué sigue?
- Obtén más información sobre Standard PayGo.
- Obtén más información sobre la capacidad de procesamiento aprovisionada.
- Obtén más información sobre las cuotas y los límites del sistema de IA generativa.
- Obtén más información sobre las cuotas de Google Cloud.