Cuotas

En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Document AI.

  • Las cuotas tienen valores predeterminados, pero, por lo general, puedes solicitar ajustes.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu proyecto de Google Cloud . Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud evitando la sobrecarga de los servicios. Las cuotas también te ayudan a administrar tus propios recursos de Google Cloud .

El sistema de cuotas Cloud realiza las siguientes acciones:

En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.

Por lo general, las cuotas se aplican a nivel del Google Cloud proyecto. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

En este documento, se enumeran las cuotas que se aplican a Document AI.

Niveles de servicio

Document AI admite dos niveles de servicio y las cuotas asociadas para las solicitudes de procesamiento en línea a las versiones de procesador potenciadas por IA generativa: niveles aprovisionado y de mejor esfuerzo.

La cuota del nivel aprovisionado proporciona 120 páginas por minuto para las versiones básicas del procesador, como los extractores personalizados v1.4 y v1.5, y 30 páginas por minuto para las versiones básicas del procesador, como el extractor personalizado v1.5 Pro.

La cuota del nivel de mejor esfuerzo proporciona 120 para las versiones básicas del procesador, como el extractor personalizado v1.4 y v1.5, y 60 para las versiones Pro del procesador, como el extractor personalizado v1.5 Pro, y solo se usa una vez que se agota la cuota aprovisionada. Esto se aplica a las cuotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (métrica best_effort_online_process_document_pages_us) y BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (métrica best_effort_online_process_document_pages_eu) en la consola.

Notas Extractor personalizado v1.4 (basado en Gemini 2.0 Flash) Extractor personalizado v1.5 (basado en Gemini 2.5 Flash) Extractor personalizado v1.5 Pro (basado en Gemini 2.5 Pro)
Aprovisionado 120 120 30
Mejor esfuerzo 120 120 60
Aprovisionamiento a nivel de la organización 240 240 60

Si necesitas más de lo que se indica en las cuotas de mejor esfuerzo, puedes realizar una solicitud de aumento de cuota (QIR) comunicándote con el equipo de ventas.

Para garantizar más capacidad disponible durante los períodos de tráfico de gran volumen, lee la sección sobre cómo realizar una solicitud de reserva de capacidad.

No hay un acuerdo de nivel de servicio para el nivel de mejor esfuerzo.

Lista de cuotas

Las siguientes cuotas se aplican a Document AI. Estas cuotas se aplican a cada proyecto de la consola de Google Cloud y se comparten en todas las aplicaciones y direcciones IP que usen ese proyecto.

Si quieres procesar más solicitudes, envía una solicitud de cuota de Document AI para tu proyecto en la consola deGoogle Cloud .

En la solicitud, proporciona información sobre tus necesidades específicas y tu caso de uso.

Cuota de solicitud Valor predeterminado Notas
Solicitudes por minuto 1,800 por usuario Ver cuota en la Google Cloud consola
Solicitudes de proceso en línea por minuto (EE.UU.) 120 por proyecto y tipo de procesador Ver cuota en la Google Cloud consola
Solicitudes de proceso en línea por minuto (UE) 120 por proyecto y tipo de procesador Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea (EE.UU.) por minuto, por tipo de procesador y versión del modelo (solo para el extractor personalizado v1.4 con Gemini 2.0 Flash) 120 páginas por minuto* Ver cuota en la Google Cloud consola
Cantidad de páginas de documentos de proceso en línea (UE) por minuto, por tipo de procesador y versión del modelo (solo Extractor personalizado v1.4 con Gemini 2.0 Flash) 120 páginas por minuto* Ver cuota en la Google Cloud consola
Cantidad de páginas de documentos procesados en línea (EE.UU.) por minuto, por tipo de procesador y versión del modelo (solo Extractor personalizado v1.5 con Gemini 2.5 Flash) 120 páginas por minuto* Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea (UE) por minuto, por tipo de procesador y versión del modelo (solo Extractor personalizado v1.5 con Gemini 2.5 Flash) 120 páginas por minuto* Ver cuota en la Google Cloud consola
Solicitudes de procesamiento en línea por minuto (una sola región) 6 por proyecto y por tipo de procesador Ver cuota en la Google Cloud consola
Solicitudes simultáneas de procesos por lotes por proyecto y región (EE.UU.) 5 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de procesos por lotes simultáneas por proyecto y región (UE) 5 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de procesamiento por lotes simultáneas por procesador (región única) 5 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de entrenamiento de versiones de procesadores (EE.UU.) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de entrenamiento de versiones del procesador (UE) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de entrenamiento de versiones del procesador (una sola región) 1 por proyecto Ver cuota en la Google Cloud consola
Versiones de procesadores personalizados implementadas (EE.UU.) 5 por proyecto Ver cuota en la Google Cloud consola
Versiones de procesadores personalizados implementadas (UE) 5 por proyecto Ver cuota en la Google Cloud consola
Versiones de procesadores personalizados implementadas (una sola región) 5 por proyecto Ver cuota en la Google Cloud consola
Versiones implementadas del procesador generativo (EE.UU.) 100 por proyecto y por procesador de extracción personalizado Ver cuota en la Google Cloud consola
Versiones de procesadores generativos implementadas (UE) 100 por proyecto y por procesador de extracción personalizado Ver cuota en la Google Cloud consola
Versiones de procesadores generativos implementadas (una sola región) 100 por proyecto y por procesador de extracción personalizado Ver cuota en la Google Cloud consola
Solicitudes simultáneas de importación de documentos (EE.UU.) 3 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de importación de documentos (UE) 3 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de importación de documentos (una sola región) 3 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de exportación de documentos (EE.UU.) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de exportación de documentos (UE) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de exportación de documentos (una sola región) 1 por proyecto Ver cuota en la Google Cloud consola

* Las solicitudes de ajuste de cuota aún no son compatibles con esta versión.

Compatible con australia-southeast1 con una solicitud de ajuste de cuota.

Cómo realizar una solicitud de reserva de capacidad

La reserva de capacidad de Document AI proporciona capacidad reservada para atender el tráfico de predicciones en tiempo real y de gran volumen durante el período suscrito, lo que ayuda a cumplir con los requisitos del Acuerdo de Nivel de Servicio (ANS). Cada unidad corresponde a una página por minuto adicional más allá de la cuota predeterminada.

La reserva de capacidad es compatible y obligatoria para aumentar las cuotas de nivel aprovisionado de los modelos de extractor personalizado v1.4 y v1.5, incluidas las versiones de procesador ajustadas que se compilan sobre ellos.

El precio de la reserva de capacidad es de USD 300 por cada página adicional por minuto y por mes.

Para realizar una solicitud de reserva de capacidad, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página IAM y administración > Reserva de capacidad:

    Reserva de capacidad

  2. Cerca del encabezado de la página, haz clic en Crear una reserva de capacidad nueva. Esta acción te llevará a un formulario de solicitud de dos páginas.

  3. Completa la página Configurar con la siguiente información:

    • Completa el nombre del pedido.
    • Selecciona una región.
    • Selecciona la versión del procesador en el menú desplegable.
    • Escribe la cantidad de páginas adicionales por minuto que se necesitan por mes.
    • Selecciona el período de suscripción mensual.
    • Selecciona la fecha y hora de inicio.
    • Selecciona una opción de renovación automática en el menú desplegable.
  4. Haz clic en Continuar.

  5. En la segunda página, verás un costo estimado por mes. Para validar la compra, ingresa Confirmar.

  6. Haz clic en Confirmar y enviar.

Podrás ver el estado de la solicitud en la pestaña Capacity Reservation.

Los tres estados posibles son los siguientes:

  • Inactivo: La suscripción aún no comenzó.
  • Activa: La suscripción está en curso.
  • Completada: Finalizó la suscripción.

Qué debes tener en cuenta antes de comprar una reserva de capacidad

Para ayudarte a decidir si quieres comprar una reserva de capacidad, ten en cuenta lo siguiente:

  • No puedes cancelar tu pedido a mitad del plazo.

    La compra de una reserva de capacidad es un compromiso, lo que significa que no puedes cancelar el pedido a mitad del plazo. Sin embargo, puedes aumentar la cantidad de GSU compradas. Si compraste un compromiso por accidente o hay un problema con la configuración, comunícate con tu Google Cloud representante de cuenta para obtener ayuda.

  • Puedes renovar automáticamente la suscripción.

    Cuando envíes tu pedido, podrás elegir renovar automáticamente la suscripción al final de su período de vigencia o dejar que la suscripción venza. Puedes cancelar el proceso de renovación automática. Para cancelar tu suscripción antes de que se renueve automáticamente, cancela la renovación automática 30 días antes del inicio del siguiente período de vigencia.

    Puedes configurar las suscripciones mensuales para que se renueven automáticamente cada mes. Los términos semanales no admiten la renovación automática.