En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Gemini para Google Cloud.
- Las cuotas tienen valores predeterminados, pero, por lo general, puedes solicitar ajustes.
- Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu proyecto de Google Cloud . Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud evitando la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud .
El sistema de cuotas de Cloud lleva a cabo las siguientes acciones:
- Supervisa tu consumo de productos y servicios de Google Cloud
- Restringe el consumo de esos recursos
- Proporciona una forma de solicitar cambios en el valor de la cuota y automatizar los ajustes de la cuota
En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso y la tarea que intentas llevar a cabo falla.
Por lo general, las cuotas se aplican a nivel de proyecto de Google Cloud . El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. En un proyecto de Google Cloud , las cuotas se comparten entre todas las aplicaciones y direcciones IP.
Para obtener más información, consulta la descripción general de cuotas de Cloud.
También existen límites del sistema para los recursos de Gemini. Los límites del sistema no se pueden cambiar.
Solicitudes por segundo
Gemini para Google Cloud aplica cuotas a las solicitudes por segundo para cada usuario de un proyecto.
| Quota | Valor |
|---|---|
| Solicitudes por segundo | 2 |
Solicitudes por día
Gemini para Google Cloud aplica cuotas para la cantidad total de solicitudes por día para cada usuario de un proyecto.
| Quota | Valor |
|---|---|
| Solicitudes por día para Gemini Code Assist o Gemini en solicitudes de código de BigQuery, como la generación y la finalización de código | 6000 |
| Solicitudes por día para chat, visualización, análisis de tablas de estadísticas de datos, generación de metadatos , preparación de datos y otras solicitudes que muestran respuestas en el panel Cloud Assist en la Google Cloud consola y los IDE | 960 |
Cuotas para Gemini Code Assist
Gemini Code Assist aplica cuotas para ciertas funciones.
| Quota | Valor |
|---|---|
| Conocimiento de la base de código local | Ventana de contexto de 1,000,000 de tokens |
| Repositorios de personalización de código | 20,000 |
Cuotas para el modo agente y la CLI de Gemini
Las cuotas para las solicitudes del modo agente de Gemini Code Assist y la CLI de Gemini se combinan. En el modo agente o cuando se usa la Gemini CLI, una instrucción puede generar varias solicitudes de modelo. Las solicitudes se limitan por usuario por minuto y están sujetas a la disponibilidad del servicio en momentos de alta demanda. Estos límites de solicitudes diarias se agregan en todas las interacciones con cualquier versión o familia de modelo (por ejemplo, Pro, Flash) que se use con la CLI de Gemini o el modo agente. Una vez que se alcanza la cantidad máxima de solicitudes por día, no se pueden realizar más solicitudes a través de estas interfaces a ningún modelo hasta que se restablezca la cuota.
| Quota | Edición de Gemini Code Assist | Valor |
|---|---|---|
| Solicitudes máximas por usuario por día | Estándar | 1500 |
| Enterprise | 2000 |
Cuotas para Gemini Code Assist en GitHub
El uso de Gemini Code Assist en GitHub no se cuenta como parte de las cuotas generales de Gemini Code Assist.
Una instalación de la versión para consumidores de la app de Gemini Code Assist en GitHub tiene una cuota de 33 revisiones de solicitud de extracción por día.
Una instalación de la versión Enterprise de la app de Gemini Code Assist en GitHub (vista previa) tiene una cuota de al menos 100 revisiones de solicitud de extracción por día.
- La cantidad exacta de revisiones de solicitud de extracción depende de la base de código y de cuántas llamadas de modelo se requieren para completar cada revisión de código. Por este motivo, en algunos casos, la cuota puede ser mucho mayor que 100.
Las cuotas de Gemini Code Assist en GitHub se restablecen en alineación con los restablecimientos de las Google Cloud cuotas.
Solicita un aumento de la cuota
Para ajustar la mayoría de las cuotas, usa la Google Cloud consola de. Para obtener más información, consulta Solicita un ajuste de cuota.