En esta página, se proporcionan las cuotas de uso y los límites que se aplican por el uso de Cloud Run.
La cantidad de recursos de Cloud Run es limitada. Las cuotas para Cloud Run abarcan los límites de frecuencia de la API, que afectan la velocidad a la que puedes llamar a la API de Administrador de Cloud Run.
No hay límite directo para lo siguiente:
- El tamaño de las imágenes de contenedor que puedes implementar.
- Es la cantidad de solicitudes simultáneas que puede entregar un servicio de Cloud Run.
Límites de recursos de Cloud Run
Para superar los límites que se pueden aumentar, solicita un aumento de cuota. Para superar los límites por proyecto que no se pueden aumentar, crea recursos nuevos en otro Google Cloud proyecto o región.
| Recurso | Alcance | Descripción | Límite | Se puede aumentar |
|---|---|---|---|---|
| Servicio | por proyecto y región | Cantidad máxima de servicios | 1,000 | No |
| Trabajo | por proyecto y región | Cantidad máxima de trabajos | 1000 | No |
| Grupo de trabajadores | por proyecto y región | Cantidad máxima de grupos de trabajadores | 1000 | No |
| Ejecución del trabajo | por proyecto y región | Cantidad máxima de ejecuciones de trabajos en ejecución | 1000 | No |
| Revisión | por servicio | Cantidad máxima de revisiones por servicio. Cuando se alcanza el límite, se borran automáticamente las revisiones que no se usan en orden cronológico | 1,000 | No |
| Revisión | por proyecto y región | Cantidad máxima de revisiones que entregan tráfico | 4000 | No |
| Etiqueta de revisión | por proyecto y región | Es la cantidad máxima de etiquetas de revisión. Cuando se supera el límite de etiquetas de revisión, Cloud Run ejecuta la limpieza de etiquetas en el servicio. En el caso del servicio para el que se crea una etiqueta nueva, las etiquetas que no tienen un porcentaje de tráfico especificado se borran automáticamente en orden cronológico. | 2000 | No |
| Ejecución del trabajo | por trabajo | Límite de retención para las ejecuciones de trabajos completadas. Cuando la cantidad de ejecuciones completadas de un trabajo alcanza este límite, las ejecuciones se borran de forma automática en orden histórico | 1,000 | No |
| Tarea de ejecución de trabajos1 | por ejecución de trabajos | Cantidad máxima de tareas que se ejecutan en paralelo | Depende de los parámetros de configuración de CPU y memoria. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. Puedes ver tu cuota en la página de la consola Cuotas y límites del sistema. | Sí |
| Tarea de ejecución de trabajos | por ejecución de trabajos | Valor máximo de tiempo de espera para las tareas | 168 horas (7 días) o 1 hora si usas GPUs | No |
| Tarea de ejecución de trabajos | por ejecución de trabajos | Cantidad máxima de tareas en un solo trabajo | 10,000 | No |
| Tarea de ejecución de trabajos | por ejecución de trabajos | Cantidad máxima de reintentos de tareas en un trabajo | 10 | No |
| Variables de entorno | por trabajo o por servicio | Cantidad máxima de variables de entorno para cada contenedor | 1000 | No |
| Argumentos del comando | por trabajo o por servicio | Cantidad máxima de argumentos de comandos para cada contenedor | 1000 | No |
| Instancia de contenedor3 | por revisión y región | Cantidad máxima de instancias de contenedor con la salida de a VPC directa | De 100 a 200, según las opciones de configuración de región seleccionadas | Sí |
| Instancias de contenedor | por instancia de contenedor | Tiempo de espera de inicio, en minutos | 4 | No |
| Memoria | por instancia de contenedor | Tamaño máximo de la memoria, en GiB | 32 | No |
| CPU | por instancia de contenedor | Cantidad máxima de CPU virtuales | 8 | No |
| CPU1 | por proyecto y región | CPU total máxima, en milivCPUs, asignada en todas las instancias durante un período de 1 minuto. | Depende de la región seleccionada. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. | Sí |
| Memoria1 | por proyecto y región | Memoria total máxima, en bytes, asignada en todas las instancias durante un período de 1 minuto. | Depende de la región seleccionada. Este límite puede ser mayor en regiones de alta capacidad o más bajo en regiones abiertas recientemente. Puedes ver tu cuota en la página de la consola Cuotas y límites del sistema. | Sí |
| Instancia de GPU sin garantía de redundancia zonal1, 4 | por proyecto y región | Cantidad máxima de instancias de contenedor con GPU | 04 | Sí |
| Instancia de GPU con garantía de redundancia zonal1, 4 | por proyecto y región | Cantidad máxima de instancias de contenedor con GPU | 04 | Sí |
| Disco | por instancia de contenedor | Máximo de sistemas de archivos en la memoria que admiten escritura, limitado por la memoria de la instancia, en GiB | 32 | No |
| Variable de entorno | por variable | Longitud variable máxima, en Kb | 32 | No |
| Asignación de dominios | por dominio principal y por semana | Cantidad máxima de certificados SSL | 50 | No |
| Asignación de dominios | por dominio principal y por semana | Cantidad máxima de certificados SSL duplicados | 5 | No |
| Token de acceso | por instancia de contenedor por segundo | Cantidad máxima de tokens de acceso únicos generados | 50 | No |
| Token de identidad | por instancia de contenedor por segundo | Cantidad máxima de tokens de identidad únicos generados | 50 | No |
| Archivos abiertos | por instancia de contenedor | Es la cantidad máxima de archivos que se pueden abrir al mismo tiempo. Corresponde a /proc/sys/fs/file-max. |
25000 | No |
1Estas cuotas regionales se usan en algunos casos en los que cada una controla lo siguiente:
Es el valor máximo que se puede elegir para el atributo instancia máxima de una revisión. Una vez que se otorga en una región determinada, todas las revisiones en esa región pueden alcanzar el límite otorgado.
Es el paralelismo máximo de un trabajo. Una vez que se otorga en una región determinada, todos los trabajos en esa región pueden alcanzar el límite otorgado.
Es el total de instancias de contenedor para ejecutar ejecuciones de trabajos en una región.
3Esta cuota regional se usa en algunos casos:
Controla el valor máximo que se puede elegir para el atributo instancia máxima de una revisión a través de la salida de VPC directa. Una vez que se otorga en una región determinada, todas las revisiones en esa región pueden alcanzar el límite otorgado.
Controla e paralelismo máximo de un trabajo a través de la salida de VPC directa. Una vez que se otorga en una región determinada, todos los trabajos en esa región pueden alcanzar el límite otorgado.
4 Los proyectos nuevos que creen un servicio con GPUs L4 recibirán automáticamente 3 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. También puedes solicitar la cuota de NvidiaL4GpuAllocPerProjectRegion o NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Si tu uso máximo de la GPU no se acerca a tu cuota, es posible que Google la disminuya.
Límites de Herramientas de redes para Cloud Run
Límites de solicitudes de Cloud Run
| Descripción | Límite | Notas |
|---|---|---|
| Cantidad máxima de solicitudes simultáneas por instancia | 1000 | |
| Cantidad máxima de transmisiones simultáneas por conexión de cliente HTTP/2 | 100 | |
| Tiempo máximo antes de que se agote el tiempo de espera por solicitud | 60 minutos | |
| Tamaño máximo de solicitudes HTTP/1 | 32 si se usa el servidor HTTP/1. No hay límite si se usa el servidor HTTP/2. | |
| Tamaño máximo de respuestas HTTP/1 | 32 MiB si no se usa Transfer-Encoding: chunked o mecanismos de transmisión |
|
| Cantidad máxima de conexiones abiertas por instancia y por tipo de salida (Internet o VPC) | 50,000 | No se aplica al tráfico de salida de VPC directa. |
| Conexiones salientes por segundo por instancia | 700 | No se aplica al tráfico de salida directa de VPC enviado a la red de VPC, que no está limitado. |
| Conexiones salientes por minuto por instancia | 5000 | No se aplica al tráfico de salida directa de VPC enviado a la red de VPC, que no está limitado. |
| Resoluciones de DNS salientes por segundo por instancia | 1000 | |
| Solicitudes entrantes por segundo a un puerto de contenedor HTTP/1 por instancia | 800 | No se aplica a los puertos de contenedor HTTP/2. |
Límites de ancho de banda para Cloud Run
Los siguientes límites de ancho de banda se aplican a las instancias de Cloud Run:
| Descripción | Límite | Notas |
|---|---|---|
| Cantidad máxima de bits por instancia para la salida a través de VPC directa | 1 Gbps | Salida en la salida de VPC directa a los destinos en la red de VPC. |
| Cantidad máxima de bits por instancia, sin incluir la salida a través de VPC directa | 600 Mbps | Se basa en la suma de los bits de entrada y los de salida, sin incluir la salida en la salida de VPC directa a los destinos en la red de VPC. |
| Frecuencia máxima total de paquetes por instancia, sin incluir la salida a través de VPC directa | 64,000 paquetes por segundo | Se basa en la suma de los paquetes de entrada y los de salida, sin incluir la salida en la salida de VPC directa a los destinos en la red de VPC. |
Si se alcanza alguno de los dos límites, la instancia de Cloud Run tendrá un ancho de banda limitado.
Límites de frecuencia de la API de Administrador de Cloud Run
Se aplican los siguientes límites de frecuencia a la API de Administrador de Cloud Run. No se aplican a las solicitudes que alcanzan los servicios implementados de Cloud Run.
| Cuota | Descripción | Límite | Se puede aumentar | Alcance |
|---|---|---|---|---|
| Solicitudes de lectura a la API de Administrador de Cloud Run | La cantidad de lecturas de la API cada 60 segundos, por región. Esta es diferente de la cantidad de solicitudes de lectura de los servicios de Cloud Run, que es ilimitada. | 3,000 cada 60 segundos | Sí | por proyecto y región |
| Solicitudes de escritura a la API de Administrador de Cloud Run | La cantidad de operaciones de escritura de la API cada 60 segundos, por región. Esta es diferente a la cantidad de solicitudes de escritura a los servicios de Cloud Run, que es ilimitada. | 180 cada 60 segundos | Sí | por proyecto y región |
| Ejecución de trabajo | Cantidad máxima de veces que se puede ejecutar un trabajo cada 60 segundos por región. | 180 cada 60 segundos | Sí | por proyecto y región |
Cómo aumentar la cuota
Las solicitudes de ajuste de cuotas de Cloud están sujetas a revisión. Si tu solicitud de ajuste de cuota requiere una revisión, recibirás un correo electrónico en el que se confirmará la recepción de la solicitud. Si necesitas asistencia adicional, responde el correo electrónico. Después de revisar tu solicitud, recibirás una notificación por correo electrónico en la que se indicará si se aprobó. Puedes solicitar un ajuste de cuota a través de la consola de Google Cloud , la API de Cloud Quotas o Google Cloud CLI. En las siguientes instrucciones, se muestra cómo solicitar un nuevo valor de cuota con la consola de Google Cloud o con una solicitud de REST a la API de Cloud Quotas.
Console
Para solicitar un ajuste de cuota, sigue estos pasos:
En la consola de Google Cloud , ve a la página IAM y administración > Cuotas y límites del sistema:
Si se te solicita que selecciones un proyecto, elige el que quieras ajustar.Busca la cuota que deseas ajustar y abre el diálogo Cambios de cuota:
Cuotas que no se incluyen en la tabla:
- Busca tu cuota en el cuadro de búsqueda Filtrar. No especifiques la región o la zona (si corresponde), ya que las cuotas que no tienen valores de uso o ajustados no se muestran en la tabla.
- Busca cualquier entrada de tu cuota en la tabla. Puede ser la entrada predeterminada o cualquier entrada con historial, independientemente de la región o la zona.
- En la línea de la entrada, haz clic en Más acciones > Configurar regiones o zonas adicionales.
- Selecciona la región o zona que deseas ajustar. Haz clic en Editar.
Todas las demás cuotas:
- Busca tu cuota en el cuadro de búsqueda Filtrar.
- En la línea de la entrada, selecciona la casilla de verificación de tu cuota.
- Haz clic en Editar.
Aparecerá el diálogo Cambios en la cuota.
Si ves un vínculo a Solicitar una cuota mayor sobre el campo Valor nuevo y quieres aumentar el valor de tu cuota más allá del número indicado en la pantalla, sigue el vínculo. Completa el formulario, envíalo y omite los pasos restantes aquí. De lo contrario, continúa siguiendo esta guía.
En el campo Valor nuevo, ingresa el valor de cuota aumentado que deseas. Si aparece el campo Descripción de la solicitud, ingresa una descripción. Haz clic en Listo.
- Si ves una casilla de verificación con el texto "Comprendo que esta solicitud quitará cualquier anulación", el valor de tu cuota se estableció por debajo del predeterminado. Si ajustas el valor de la cuota al valor predeterminado o por sobre este, se quitará la anulación. Para continuar, selecciona la casilla de verificación. Obtén más información sobre las anulaciones de cuotas.
Si aparece el botón Siguiente, haz clic en Siguiente y completa los detalles de tu contacto en la pantalla que aparece a continuación.
Haz clic en Enviar solicitud.
Si notas que no puedes solicitar un ajuste desde la consola, solicita el aumento desde Atención al cliente de Cloud.
Para obtener más información sobre cómo funciona el proceso de aumento de cuota, consulta Acerca de los ajustes de cuota.
Agrupación de solicitudes para ajustes de cuota
Para enviar solicitudes por lotes de ajustes de cuota, selecciona la casilla de verificación de cada cuota que quieras incluir. Sin embargo, las solicitudes por lotes pueden aumentar el tiempo que Google Cloud tarda en revisar tu solicitud.
Para reducir el tiempo de revisión, agrupa las solicitudes de ajuste de cuota por producto y área. Por ejemplo, si quieres solicitar ajustes en las cuotas de redes y de VM de Compute Engine, crea una solicitud para las cuotas de redes y otra para las cuotas de VMs de Compute Engine.
REST
Para solicitar un ajuste de cuota a la API de Cloud Quotas, usa la siguiente muestra de código. Completa los marcadores de posición editables con tus valores. Para obtener información sobre los campos de marcador de posición, consulta las descripciones que se encuentran después de la muestra de código.
POST projects/PROJECT_NUMBER/locations/global/quotaPreferences?quotaPreferenceId=QUOTA_PREFERENCE_ID { "service": "SERVICE_ID", "quotaId": "QUOTA_ID", "quotaConfig": { "preferredValue": "NEW_QUOTA_VALUE" }, "dimensions": { "DIMENSION_1": "VALUE_1", "DIMENSION_2": "VALUE_2" }, "justification": "JUSTIFICATION", "contactEmail": "EMAIL" }
Reemplaza lo siguiente:
PROJECT_NUMBER: Es el número de tu proyecto de Google Cloud . Puedes encontrar el número del proyecto en la página de bienvenida de la consola de Google Cloud o ejecutando el siguiente comando de gcloud CLI:PROJECT=$(gcloud info --format='value(config.project)') gcloud projects describe ${PROJECT} --format="value(projectNumber)"
QUOTA_PREFERENCE_ID: Es el ID de la preferencia de cuota que actualizas.QUOTA_ID: Es el ID de la cuota que actualizas.SERVICE_ID: Es el ID del Google Cloud al que pertenece la cuota que ajustas. Por lo general, tiene el formatoSERVICE_NAME.googleapis.com. Por ejemplo, el nombre del servicio de Compute Engine escompute.googleapis.com.DIMENSION_1: Es el tipo de dimensión que deseas ajustar, por ejemplo,regionozone. Puedes incluir varias dimensiones. Separa cada dimensión con una coma después de su valor, por ejemplo,VALUE_1. Para ajustar todas las dimensiones de la cuota, omite esta línea.VALUE_1: Es el valor de la dimensión anterior. Por ejemplo, si la dimensión anterior esregion, ingresa una región comous-central1.JUSTIFICATION: Es el motivo de esta solicitud.EMAIL: Una dirección de correo electrónico que se puede usar como contacto, en caso de que Google Cloud necesite más información para tomar una decisión antes de que se pueda otorgar una cuota adicional
Ejemplo de solicitud
A continuación, se muestra un ejemplo de una solicitud de aumento del valor de la cuota para la cuota de Compute Engine PUS-PER-GPU-FAMILY-per-project-region. Solicita un valor de cuota de 100 para las máquinas de la familia de GPU NVIDIA_H100 que se encuentran en la región us-central1.
POST projects/123/locations/global/quotaPreferences?quotaPreferenceId=my_quota_preference_ID {
"service": "compute.googleapis.com",
"quotaId": "GPUS-PER-GPU-FAMILY-per-project-region",
"quotaConfig": { "preferredValue": 100 },
"dimensions": { "region": "us-central1", "gpu_family": "NVIDIA_H100" },
"justification": "My justification.",
"contactEmail": "222larabrown@gmail.com"
}