Configurar la simultaneidad

Consulta cómo definir el número máximo de solicitudes que puede procesar simultáneamente una instancia de contenedor determinada en Knative Serving. Más información sobre la simultaneidad

Cualquier cambio en la configuración conlleva la creación de una nueva revisión. Las revisiones posteriores también recibirán automáticamente este ajuste de configuración, a menos que hagas cambios explícitos para modificarlo.

Puedes configurar los ajustes de simultaneidad mediante la Google Cloud consola o la CLI de Google Cloud al desplegar un servicio nuevo o actualizar uno que ya tengas y desplegar una revisión:

Consola

  1. Ve a Knative Serving en la Google Cloud consola:

    Ir a Knative serving

  2. Haga clic en Crear servicio si va a configurar un servicio nuevo que va a implementar. Si va a configurar un servicio que ya tiene, haga clic en él y, a continuación, en Editar y desplegar nueva revisión.

  3. En Configuración avanzada, haga clic en Contenedor.

  4. Define el valor de simultaneidad que quieras en el cuadro de texto Número máximo de solicitudes por contenedor.

  5. Haz clic en Siguiente para ir a la siguiente sección.

  6. En la sección Configurar la activación del servicio, selecciona la conectividad que quieras usar para invocar el servicio.

  7. Haz clic en Crear para desplegar la imagen en Knative Serving y espera a que se complete el despliegue.

Línea de comandos

  • En el caso de los servicios que ya tengas, define el número máximo de solicitudes simultáneas ejecutando el comando gcloud run services update con el parámetro --concurrency:

    gcloud run services update SERVICE --concurrency CONCURRENCY

    Sustituye:

    • SERVICE con el nombre de tu servicio.
    • CONCURRENCY con el número máximo de solicitudes simultáneas por instancia de contenedor. Especifique default para borrar cualquier ajuste de simultaneidad: --concurrency default.
  • En el caso de los servicios nuevos, define el número máximo de solicitudes simultáneas ejecutando el comando gcloud run deploy con el parámetro --concurrency:

    gcloud run deploy SERVICE --image=IMAGE_URL --concurrency CONCURRENCY

    Sustituye:

    • SERVICE con el nombre de tu servicio.
    • IMAGE_URL con una referencia a la imagen del contenedor, por ejemplo, gcr.io/cloudrun/hello.
    • CONCURRENCY con el número máximo de solicitudes simultáneas por instancia de contenedor. Especifique default para borrar cualquier ajuste de simultaneidad: --concurrency default.

YAML

Puedes descargar la configuración de un servicio en un archivo YAML con el comando gcloud run services describe mediante la marca --format=export. A continuación, puedes modificar ese archivo YAML e implementar los cambios con el comando gcloud run services replace. Debe asegurarse de modificar solo los atributos especificados.

  1. Descarga la configuración de tu servicio en un archivo llamado service.yaml en el espacio de trabajo local:

    gcloud run services describe SERVICE --format export > service.yaml

    Sustituye SERVICE por el nombre de tu servicio de Knative.

  2. En su archivo local, actualice el atributo containerConcurrency:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containerConcurrency: CONCURRENCY

    Sustituye:

    • SERVICE con el nombre de tu servicio de Knative
    • CONCURRENCY con el número máximo de solicitudes simultáneas por instancia de contenedor. Especifica default para borrar los ajustes de simultaneidad: --concurrency default.
  3. Sustituye el servicio por su nueva configuración con el siguiente comando:

    gcloud run services replace service.yaml