Cuotas y límites del sistema

En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Model Armor.

  • Las cuotas tienen valores predeterminados, pero, por lo general, puedes solicitar ajustes.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu proyecto de Google Cloud . Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud evitando la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud .

El sistema de cuotas de Cloud lleva a cabo las siguientes acciones:

En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso y la tarea que intentas llevar a cabo falla.

Por lo general, las cuotas se aplican a nivel de proyecto de Google Cloud . El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un proyecto de Google Cloud , las cuotas se comparten entre todas las aplicaciones y direcciones IP.

Para obtener más información, consulta la descripción general de cuotas de Cloud.

Cuota de consultas a la API

Puedes aumentar esta cuota en la Google Cloud consola, de manera similar a otros servicios de Google Cloud .

Cuota Valor
Consultas de API 1,200 consultas por minuto (QPM) por proyecto

Límite del sistema para el tamaño de la entrada

En la siguiente tabla, se especifica el límite del sistema para el tamaño del archivo o texto de entrada.

Límite del sistema Valor
Todos los archivos compatibles y el texto 4 MB

Límites del sistema de tokens

Model Armor tiene límites del sistema variables en los tokens según el filtro específico.

Filtro Límite del sistema
Detección de inyección de instrucciones y jailbreak 10,000
IA responsable 10,000
Material de abuso sexual infantil 10,000
Sensitive Data Protection 130,000

Cuando la instrucción o la respuesta superan el límite de tokens, el filtro de protección de datos sensibles devuelve EXECUTION_SKIPPED. Todos los demás filtros, si la instrucción o la respuesta superan el límite de tokens, devuelven MATCH_FOUND si se encuentra contenido malicioso dentro de los primeros 10,000 tokens o EXECUTION_SKIPPED si no se encuentra contenido malicioso en los primeros 10,000 tokens.

Obtén los nombres de las métricas de cuota y límite del sistema

Las cuotas y los límites del sistema tienen dos tipos de nombres: nombres visibles y nombres de métricas. Los nombres visibles tienen espacios y mayúsculas que facilitan su lectura. Es más probable que los nombres de las métricas estén en minúsculas y delimitados por guiones bajos en lugar de espacios. El formato exacto depende del servicio.

En las siguientes instrucciones, se muestra cómo obtener los nombres de las métricas para las cuotas y los límites del sistema con la consola de Google Cloud o gcloud CLI.

Console

  1. En la consola de Google Cloud , ve a la página IAM y administración > Cuotas y límites del sistema:

    Ir a Cuotas y límites del sistema

    En la tabla de esta página, se muestran las cuotas y los límites del sistema que tienen uso o valores ajustados, y una entrada de referencia para otras cuotas. La entrada de referencia tiene la palabra "predeterminada" entre paréntesis al final de la lista en la columna Nombre. Por ejemplo, SetIAMPolicy requests per minute per region (default) es la entrada de referencia para la cuota SetIamPolicyRequestsPerMinutePerProject.

  2. Si no ves la columna Métrica, sigue estos pasos.

    1. Haz clic en Opciones de visualización de columnas.
    2. Selecciona Métrica.
    3. Haz clic en Aceptar. La columna Métrica aparecerá en la tabla.

En la columna Métrica, se muestran los nombres de las métricas. Para filtrar los resultados, ingresa el nombre o el valor de una propiedad en el campo junto a Filtro.

gcloud

Para obtener los nombres de las métricas de un servicio Google Cloud con gcloud CLI, ejecuta el comandoquotas info list. Para omitir las líneas que no enumeran nombres de métricas, pasa el resultado a un comando como grep con metric: como término de búsqueda o usa la marca --format de gcloud CLI:

gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
    --service=SERVICE_NAME --format="value(metric)"

Reemplaza lo siguiente:

  • PROJECT_ID_OR_NUMBER: Es el ID o número del proyecto.
  • SERVICE_NAME: Es el nombre del servicio cuyas métricas de cuota deseas ver. Por ejemplo, el nombre del servicio de Compute Engine es compute.googleapis.com. Incluye la parte googleapis.com del nombre del servicio.

Solicita un ajuste de cuota

Para ajustar la mayoría de las cuotas, usa la consola de Google Cloud . Para obtener más información, consulta Solicita un ajuste de cuota.