Prácticas recomendadas para optimizar los costos de los servicios de Cloud Run

En esta página, se explican algunos aspectos que debes tener en cuenta cuando configures tus servicios de Cloud Run. No existe una solución única para la optimización de costos. Es importante supervisar tus necesidades, tu presupuesto y tus recursos para determinar qué te conviene más.

Las prácticas recomendadas que se describen en este documento son específicas de Cloud Run. Estos no incluyen otros productos Google Cloud .

Parámetros de configuración de recursos

Optimizar tus servicios para reducir los costos implica tener en cuenta muchas configuraciones diferentes. Adapta estas configuraciones a tus necesidades para crear servicios confiables y rentables.

Selecciona la región adecuada

La ubicación de implementación de tu servicio afecta el costo total. Cloud Run usa un modelo de precios regional de dos niveles. Las regiones de nivel 1 ofrecen un costo por CPU virtual y memoria más bajo en comparación con las regiones de nivel 2, por lo que te recomendamos que realices la implementación en una región de nivel 1.

Necesita autenticación

Cuando configuras un servicio de Cloud Run, puedes elegir una de las dos opciones de autenticación:

  • Permitir acceso público: No se requieren verificaciones de autenticación.
  • Requerir autenticación: Solo los usuarios autenticados pueden acceder a tu servicio de Cloud Run.

Te recomendamos que exijas la autenticación, a menos que tengas una necesidad específica de permitir el acceso público. Esto evitará solicitudes no deseadas que podrían generar costos.

Si administras usuarios con Identity-Aware Proxy (IAP), es posible que IAP tenga sus propios costos asociados.

Comparación de la facturación basada en instancias con la facturación basada en solicitudes

Los servicios de Cloud Run tienen dos parámetros de configuración de facturación:

  • Facturación basada en solicitudes (opción predeterminada): Se te cobra por solicitud, además de una tarifa por segundo más alta para la CPU virtual y la memoria que se consumen durante el procesamiento de solicitudes.
  • Facturación basada en instancias: Se te cobra por todo el ciclo de vida de una instancia. No hay una tarifa por solicitud, y las tarifas por segundo para la CPU virtual y la memoria son más bajas.

Para los servicios con tráfico estable y con variaciones lentas, considera usar la facturación basada en instancias. Los ahorros que se obtienen por las tarifas de procesamiento más bajas y la ausencia de una tarifa por solicitud superan el costo de pagar el tiempo de inactividad entre solicitudes. Para los servicios con tráfico esporádico, repentino o con picos, considera usar la facturación basada en solicitudes. Si aún no sabes qué configuración de facturación usar, consulta Recomendador. El Recomendador analiza el tráfico que recibió tu servicio de Cloud Run durante el último mes y proporciona recomendaciones para cambiar de la facturación basada en solicitudes a la facturación basada en instancias, si es más económico hacerlo.

Configura el escalamiento del servicio a nivel del servicio

Para establecer un modelo de referencia de seguridad de costos, configura las instancias máximas para tu servicio. Establecer un número máximo más alto prioriza la disponibilidad, pero introduce posibles riesgos de facturación por picos inesperados de tráfico o errores de configuración. Debes configurar este parámetro a nivel del servicio cuando implementes tu servicio inicialmente para establecer un valor de referencia del costo. Para obtener más herramientas de control de costos, consulta las cuotas de asignación de recursos o los presupuestos y alertas de facturación.

Optimiza el uso de la CPU y la memoria

El costo de tu servicio de Cloud Run se ve afectado por su configuración de CPU y memoria, y el tiempo que está activo, entre otros factores. El aprovisionamiento excesivo de tus recursos puede aumentar tus costos. Para determinar qué configuración podría ser la mejor para tu servicio, haz lo siguiente:

  1. Establece una configuración de referencia.
  2. Supervisa tus métricas mientras pruebas las métricas de uso de CPU y memoria en Cloud Monitoring.
  3. Ajusta la configuración según sea necesario.

Si el uso de CPU es constantemente bajo en condiciones de carga máxima, considera reducir la asignación de CPU virtuales. Si la latencia es alta, considera aumentar la asignación de CPU virtuales.

Si el uso de la memoria es constantemente bajo, considera reducir la memoria asignada. Si la latencia es alta y la utilización de la memoria se acerca al 100%, considera aumentar la memoria asignada. Si experimentas errores de memoria insuficiente (OOM), debes aumentar la memoria asignada o modificar tu aplicación para evitar pérdidas de memoria o usar menos memoria. Consulta el panel de Cloud Monitoring para comprender mejor tu uso de memoria.

Configura la GPU

Todos los servicios de Cloud Run que usan GPUs deben tener configurada la facturación basada en instancias. Esto significa que se cobra por las instancias de Cloud Run durante todo su ciclo de vida, incluso cuando no hay solicitudes entrantes. Las configuraciones mínimas de CPU y memoria requeridas para las GPU también afectan el costo de tu servicio de Cloud Run. De forma predeterminada, la redundancia zonal de GPU está activada. Desactivar la redundancia zonal de la GPU genera un costo más bajo por segundo de GPU, pero no garantiza la capacidad reservada para situaciones de conmutación por error.

Optimiza los costos de redes

Cuando configures las opciones de redes para tu servicio, ten en cuenta lo siguiente:

  • Coloca tus recursos en la misma ubicación: Intenta implementar tus servicios de Cloud Run en la misma región que tus bases de datos de backend (como Cloud SQL o Firestore) y los buckets de Cloud Storage. La transferencia de datos entre recursos de Google Cloud dentro de la misma región es gratuita.
  • Cambia a la salida de VPC directa: Si enrutas tráfico de forma segura a recursos internos de la red de VPC, considera cambiar a la salida de VPC directa desde los conectores de Acceso a VPC sin servidores. La salida de VPC directa se ajusta a cero, lo que elimina la sobrecarga de procesamiento de referencia y los costos de inactividad asociados con las instancias del conector.
  • Usa Cloud CDN: Descarga recursos estáticos y contenido altamente apto para el almacenamiento en caché colocando Cloud CDN frente a tus servicios de Cloud Run. Publicar datos desde el borde es mucho más económico que pagar por la salida estándar de Internet directamente desde Cloud Run.
  • Supervisa la salida de Internet: El tráfico entrante (entrada) siempre es gratuito, y recibes 1 GiB de transferencia de datos salientes de Internet gratis por mes en Norteamérica. Enfoca tus esfuerzos de supervisión en el tráfico saliente que cruza los límites regionales o supera el nivel gratuito.

Cómo configurar los parámetros de simultaneidad

Cuando más instancias procesan solicitudes, Cloud Run asigna más CPU y memoria a costos más altos. Un parámetro de configuración de simultaneidad más alto permite que menos instancias controlen el mismo volumen de solicitudes, lo que puede reducir los costos. Sin embargo, el código de la aplicación debe poder controlar las solicitudes paralelas de manera eficiente. Para obtener más información, consulta Cómo ajustar la simultaneidad para el ajuste de escala automático y el uso de recursos.

Descuentos por compromiso de uso

Los descuentos por compromiso de uso (CUD) proporcionan precios con descuento a cambio de comprometerse a usar Cloud Run de forma continua durante un período específico. Los CUD se aplican a nivel de la cuenta de facturación de Cloud. Puedes comprar CUD flexibles de Compute para los recursos de Cloud Run. Los CUD flexibles de Compute no se aplican a las GPU ni a las redes. Consulta Descuento por compromiso de uso flexible de Compute para obtener más detalles.

Herramientas útiles

Puedes usar las siguientes herramientas para comprender mejor tus costos y evitar excederlos.

Descripción general de Cloud Run: panel de facturación

En la página de descripción general de Cloud Run, se muestran los costos por nombre de recurso en el panel Facturación. Las cifras reflejan los costos brutos de los períodos seleccionados por recurso. Esta herramienta te ayuda a comprender mejor cuánto cuestan tus recursos.

Alertas de presupuesto

Crea alertas de presupuesto en la Facturación de Cloud para hacer un seguimiento de tus costos reales en función de tus costos planificados. Un presupuesto es un mecanismo de alerta que activa notificaciones cuando se superan los umbrales de gasto, no un límite de gasto fijo. Existe una demora en los datos de facturación que podría afectar el momento en que recibes las alertas.

Facturación de Cloud

La Facturación de Cloud es un conjunto de herramientas que te ayudan a hacer un seguimiento de tus gastos de Google Cloud y comprenderlos. Estas herramientas te ayudan a supervisar los costos de uso, prever los gastos e identificar oportunidades para ahorrar costos.

Explorador de costos

El Explorador de costos te permite comprender el costo y la utilización de tus recursos. Usa el Explorador de costos para hacer lo siguiente:

  • Filtra tus recursos por costo para ver cuáles son los más costosos.
  • Comprende qué proporción de los costos se debe a configuraciones como las de CPU virtual, GPU, redes y mucho más.
  • Hacer un seguimiento de los impactos de los cambios en la configuración de tus recursos en tu factura mensual

Google Cloud calculadora de precios

El Google Cloud resumen de precios contiene información para comprender mejor el modelo de precios de Google Cloud . Aquí también puedes encontrar la Lista de precios detallada. Puedes estimar tus costos agregando y configurando productos con la calculadora de precios.

Recomendador

El Recomendador es una herramienta que proporciona recomendaciones de uso y estadísticas para los productos de Cloud.

El Recomendador observa automáticamente el tráfico que recibe tu servicio de Cloud Run en el último mes y te recomendará cambiar de la facturación basada en solicitudes a la facturación basada en instancias, si es más económico.

Optimización de Cloud Hub

Puedes ver datos de costos resumidos, datos de utilización y recomendaciones de optimización de costos para los servicios de Google Cloud en la página Optimización de Cloud Hub.