Cuotas y límites del sistema

En este documento se indican las cuotas y los límites del sistema que se aplican a Model Armor.

  • Las cuotas tienen valores predeterminados, pero normalmente puedes solicitar ajustes.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de unGoogle Cloud recurso que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una serie de tipos de recursos, incluidos componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir el número de llamadas a una API enviadas a un servicio, el número de balanceadores de carga que usa tu proyecto de forma simultánea o el número de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud al evitar que se sobrecarguen los servicios. Las cuotas también te ayudan a gestionar tus propios Google Cloud recursos.

El sistema de cuotas de Cloud hace lo siguiente:

En la mayoría de los casos, cuando intentas consumir más recursos de los que permite la cuota, el sistema bloquea el acceso al recurso y la tarea que intentas realizar falla.

Las cuotas se aplican generalmente a nivel de Google Cloud proyecto. El uso que hagas de un recurso en un proyecto no afectará a la cuota disponible en otro proyecto. En un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

Para obtener más información, consulta la descripción general de las cuotas de Cloud.

Cuota de consultas a la API

Puedes aumentar esta cuota en la consola, de forma similar a otros servicios. Google Cloud Google Cloud

Cuota Valor
Consultas de la API 1200 consultas por minuto (QPM) por proyecto

Límite del sistema para el tamaño de entrada

En la siguiente tabla se especifica el límite del sistema en cuanto al tamaño del archivo o texto de entrada.

Límite del sistema Valor
Todos los archivos y textos admitidos 4 MB

Límites del sistema de tokens

Model Armor tiene límites de sistema variables en los tokens en función del filtro específico.

Filtro Límite del sistema
Detección de inyección de peticiones y jailbreaking 10.000
IA responsable 10.000
Material de abuso sexual infantil 10.000
Protección de Datos Sensibles 130.000

Si la petición o la respuesta superan el límite de tokens, el filtro de Protección de Datos Sensibles devuelve EXECUTION_SKIPPED. Todos los demás filtros, si la petición o la respuesta superan el límite de tokens, devuelven MATCH_FOUND si se encuentra contenido malicioso en los primeros 10.000 tokens o EXECUTION_SKIPPED si no se encuentra contenido malicioso en los primeros 10.000 tokens.

Obtener nombres de métricas de cuotas y límites del sistema

Las cuotas y los límites del sistema tienen dos tipos de nombres: nombres visibles y nombres de métrica. Los nombres visibles tienen espacios y mayúsculas que facilitan la lectura a los usuarios. Es más probable que los nombres de las métricas estén en minúsculas y delimitados por guiones bajos en lugar de espacios. El formato exacto depende del servicio.

En las siguientes instrucciones se muestra cómo obtener los nombres de las métricas de las cuotas y los límites del sistema mediante la consola Google Cloud o la CLI de gcloud.

Consola

  1. En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:

    Ir a Cuotas y límites del sistema

    En la tabla de esta página se muestran las cuotas y los límites del sistema que tienen un uso o valores ajustados, así como una entrada de referencia para otras cuotas. La entrada de referencia tiene la palabra "default" entre paréntesis al final de la lista en la columna Nombre. Por ejemplo, SetIAMPolicy requests per minute per region (default) es la entrada de referencia de la cuota SetIamPolicyRequestsPerMinutePerProject.

  2. Si no ve la columna Métrica, siga estos pasos.

    1. Haz clic en Opciones de visualización de columnas.
    2. Selecciona Métrica.
    3. Haz clic en Aceptar. La columna Métrica aparece en la tabla.

En la columna Métrica se muestran los nombres de las métricas. Para filtrar los resultados, introduce un nombre o un valor de propiedad en el campo situado junto a Filtrar.

gcloud

Para obtener los nombres de las métricas de un servicio Google Cloud con gcloud CLI, ejecuta el comando quotas info list. Para omitir las líneas que no incluyan nombres de métricas, envía la salida a un comando como grep con metric: como término de búsqueda o usa la marca --format de gcloud CLI:

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

Haz los cambios siguientes:

  • PROJECT_ID_OR_NUMBER: el ID o el número del proyecto.
  • SERVICE_NAME: el nombre del servicio cuyas métricas de cuota quieres ver. Por ejemplo, el nombre del servicio de Compute Engine es compute.googleapis.com. Incluye la parte googleapis.com del nombre del servicio.

Solicitar un ajuste de cuota

Para ajustar la mayoría de las cuotas, usa la Google Cloud consola. Para obtener más información, consulta Solicitar un ajuste de cuota.