Cuotas y límites

En este documento se indican las cuotas y los límites del sistema que se aplican a Batch.

  • Las cuotas tienen valores predeterminados, pero normalmente puedes solicitar ajustes.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Las tareas por lotes se ejecutan en recursos de Compute Engine, por lo que Batch también está sujeto a las cuotas y los límites de Compute Engine. Si tu trabajo por lotes también usa otros Google Cloud servicios, estará sujeto a las cuotas de esos servicios. Si intentas superar una cuota o un límite, se devolverá un error. Para obtener más información, consulta la documentación de cuotas de Cloud.

Además de las cuotas y los límites de otros Google Cloud servicios, Batch tiene las siguientes cuotas y límites, que no se pueden cambiar.

Cuotas de frecuencia

Se aplican los siguientes límites a las solicitudes por lotes. Estos límites se muestran como cuotas (por ejemplo, en la consola Google Cloud ), pero no se pueden aumentar.

Límite Valor
Solicitudes de agente por minuto y región 30.000
Solicitudes de mutación por minuto y región 6000
Solicitudes de lectura por minuto y región 15.000

Límites de tareas

Se aplican los siguientes límites a las tareas por lotes.

Límite Valor
Tareas por grupo de tareas 100.000
Tareas paralelas por trabajo 5000
Máquinas virtuales simultáneas por trabajo de una sola zona1 2000
Máquinas virtuales simultáneas por trabajo multizona1 4000
Tamaño de la definición del trabajo2 1 MB
Tiempo de espera (duración del estado de la tarea QUEUED) antes de que se produzca un fallo automático 2 días
Tiempo de ejecución (duración del estado de la tarea RUNNING) antes de que se produzca un fallo automático3 14 días

1 Los términos tarea de una sola zona y tarea de varias zonas hacen referencia al número de zonas permitidas para las VMs de una tarea, que puede ser diferente de las zonas de la ubicación de una tarea. Para obtener más información, consulta Ubicaciones de lotes.

2 Por ejemplo, aproximadamente el tamaño de la solicitud REST al método jobs.create o al archivo --config de gcloud CLI. Puedes evitar este límite dividiendo las tareas en varios trabajos. Por ejemplo, consulta cómo programar trabajos dependientes (vista previa).

3 Este límite tiene las siguientes excepciones:

  • Si asignas el valor provisioningModel al campo FLEX_START de una tarea, el tiempo de ejecución máximo antes de que se produzca un error automático será de 7 días.
  • Si un trabajo usa un tipo de máquina de la serie A3, define el campo reservation como NO_RESERVATION y el campo provisioningModel no está definido o se ha definido como STANDARD, el tiempo de ejecución máximo antes de que se produzca un error automático es de 7 días.
  • También puedes reducir el tiempo máximo de ejecución antes de que se produzca un fallo automático en una tarea mediante tiempos de espera.