Cuotas y límites

En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Gemini para Google Cloud.

  • Las cuotas tienen valores predeterminados, pero, por lo general, puedes solicitar ajustes.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu proyecto de Google Cloud . Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud evitando la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud .

El sistema de cuotas de Cloud lleva a cabo las siguientes acciones:

En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso y la tarea que intentas llevar a cabo falla.

Por lo general, las cuotas se aplican a nivel de proyecto de Google Cloud . El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. En un proyecto de Google Cloud , las cuotas se comparten entre todas las aplicaciones y direcciones IP.

Para obtener más información, consulta la descripción general de cuotas de Cloud.

También existen límites del sistema para los recursos de Gemini. Los límites del sistema no se pueden cambiar.

Solicitudes por segundo

Gemini para Google Cloud aplica cuotas a las solicitudes por segundo para cada usuario de un proyecto.

Quota Valor
Solicitudes por segundo 2

Solicitudes por día

Gemini para Google Cloud aplica cuotas para la cantidad total de solicitudes por día para cada usuario de un proyecto.

Quota Valor
Solicitudes por día para Gemini Code Assist o Gemini en solicitudes de código de BigQuery, como la generación y la finalización de código 6000
Solicitudes por día para chat, visualización, análisis de tablas de estadísticas de datos, generación de metadatos , preparación de datos y otras solicitudes que muestran respuestas en el panel Cloud Assist en la Google Cloud consola y los IDE 960

Cuotas para Gemini Code Assist

Gemini Code Assist aplica cuotas para ciertas funciones.

Quota Valor
Conocimiento de la base de código local Ventana de contexto de 1,000,000 de tokens
Repositorios de personalización de código 20,000

Cuotas para el modo agente y la CLI de Gemini

Las cuotas para las solicitudes del modo agente de Gemini Code Assist y la CLI de Gemini se combinan. En el modo agente o cuando se usa la Gemini CLI, una instrucción puede generar varias solicitudes de modelo. Las solicitudes se limitan por usuario por minuto y están sujetas a la disponibilidad del servicio en momentos de alta demanda. Estos límites de solicitudes diarias se agregan en todas las interacciones con cualquier versión o familia de modelo (por ejemplo, Pro, Flash) que se use con la CLI de Gemini o el modo agente. Una vez que se alcanza la cantidad máxima de solicitudes por día, no se pueden realizar más solicitudes a través de estas interfaces a ningún modelo hasta que se restablezca la cuota.

Quota Edición de Gemini Code Assist Valor
Solicitudes máximas por usuario por día Estándar 1500
Enterprise 2000

Cuotas para Gemini Code Assist en GitHub

El uso de Gemini Code Assist en GitHub no se cuenta como parte de las cuotas generales de Gemini Code Assist.

  • Una instalación de la versión para consumidores de la app de Gemini Code Assist en GitHub tiene una cuota de 33 revisiones de solicitud de extracción por día.

  • Una instalación de la versión Enterprise de la app de Gemini Code Assist en GitHub (vista previa) tiene una cuota de al menos 100 revisiones de solicitud de extracción por día.

    • La cantidad exacta de revisiones de solicitud de extracción depende de la base de código y de cuántas llamadas de modelo se requieren para completar cada revisión de código. Por este motivo, en algunos casos, la cuota puede ser mucho mayor que 100.

Las cuotas de Gemini Code Assist en GitHub se restablecen en alineación con los restablecimientos de las Google Cloud cuotas.

Solicita un aumento de la cuota

Para ajustar la mayoría de las cuotas, usa la Google Cloud consola de. Para obtener más información, consulta Solicita un ajuste de cuota.