Cuotas

En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Document AI.

  • Las cuotas tienen valores predeterminados, pero, por lo general, puedes solicitar ajustes.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu proyecto de Google Cloud . Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud evitando la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud .

El sistema de cuotas de Cloud lleva a cabo las siguientes acciones:

En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso y la tarea que intentas llevar a cabo falla.

Por lo general, las cuotas se aplican a nivel de proyecto de Google Cloud . El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. En un proyecto de Google Cloud , las cuotas se comparten entre todas las aplicaciones y direcciones IP.

Para obtener más información, consulta la descripción general de cuotas de Cloud.

Para aumentar la capacidad disponible de tus proyectos, consulta las solicitudes de reserva de capacidad.

Niveles de servicio

Document AI admite dos niveles de servicio y las cuotas asociadas para las solicitudes de procesamiento en línea a las versiones de procesador potenciadas por IA generativa: niveles aprovisionado y de mejor esfuerzo.

La cuota del nivel aprovisionado proporciona 120 páginas por minuto para las versiones básicas del procesador, como los extractores personalizados v1.4 y v1.5, y 30 páginas por minuto para las versiones básicas del procesador, como el extractor personalizado v1.5 Pro.

La cuota del nivel de mejor esfuerzo proporciona 120 para las versiones básicas del procesador, como el extractor personalizado v1.4 y v1.5, y 60 para las versiones Pro del procesador, como el extractor personalizado v1.5 Pro, y solo se usa una vez que se agota la cuota aprovisionada. Esto se aplica a las cuotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (métrica best_effort_online_process_document_pages_us) y BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (métrica best_effort_online_process_document_pages_eu) en la consola.

Notas Extractor personalizado v1.4 (basado en Gemini 2.0 Flash) Extractor personalizado v1.5 (basado en Gemini 2.5 Flash) Extractor personalizado v1.5 Pro (basado en Gemini 2.5 Pro)
Aprovisionado 120 120 30
Mejor esfuerzo 120 120 60
Aprovisionamiento a nivel de la organización 240 240 60

Si necesitas más cuota de la que se indica en las cuotas de mejor esfuerzo, puedes realizar una solicitud de aumento de cuota (QIR) comunicándote con el equipo de ventas.

Para garantizar más capacidad disponible durante el tráfico de gran volumen, lee la sección sobre cómo realizar una solicitud de reserva de capacidad.

No hay un acuerdo de nivel de servicio para el nivel de mejor esfuerzo.

Lista de cuotas

Las siguientes cuotas se aplican a Document AI. Estas cuotas se aplican a cada proyecto de la consola de Google Cloud y se comparten en todas las aplicaciones y direcciones IP que usen ese proyecto.

Si quieres procesar más solicitudes, envía una solicitud de cuota de Document AI para tu proyecto en la consola deGoogle Cloud .

En la solicitud, proporciona información sobre tus necesidades específicas y tu caso de uso.

Cuota de solicitud Valor predeterminado Notas
Solicitudes por minuto 1,800 por usuario Ver cuota en la Google Cloud consola
Solicitudes de proceso en línea por minuto (EE.UU.) 120 por proyecto y tipo de procesador Ver cuota en la Google Cloud consola
Solicitudes de proceso en línea por minuto (UE) 120 por proyecto y tipo de procesador Ver cuota en la Google Cloud consola
Cantidad de páginas de documentos procesados en línea (EE.UU.) por minuto, por tipo de procesador y versión del modelo (solo el extractor personalizado v1.4 con Gemini 2.0 Flash) 120 páginas por minuto* Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea (UE) por minuto, por tipo de procesador y versión del modelo (solo Extractor personalizado v1.4 con Gemini 2.0 Flash) 120 páginas por minuto* Ver cuota en la Google Cloud consola
Cantidad de páginas de documentos procesados en línea (EE.UU.) por minuto, por tipo de procesador y versión del modelo (solo para el extractor personalizado v1.5 con Gemini 2.5 Flash) 120 páginas por minuto* Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea (UE) por minuto, por tipo de procesador y versión del modelo (solo para el extractor personalizado v1.5 con Gemini 2.5 Flash) 120 páginas por minuto* Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos con el mejor esfuerzo en línea (EE.UU.) por minuto, por tipo de procesador y versión del modelo 120 páginas por minuto Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea con el mayor esfuerzo posible (UE) por minuto, por tipo de procesador y versión del modelo 120 páginas por minuto Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea con el mayor esfuerzo posible (región única) por minuto, por tipo de procesador y versión del modelo 120 páginas por minuto Ver cuota en la Google Cloud consola
Solicitudes de procesamiento en línea por minuto (una sola región) 6 por proyecto y por tipo de procesador Ver cuota en la Google Cloud consola
Solicitudes simultáneas de procesos por lotes por proyecto y región (EE.UU.) 5 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de procesos por lotes simultáneas por proyecto y región (UE) 5 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de procesamiento por lotes simultáneas por procesador (región única) 5 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de entrenamiento de versiones de procesadores (EE.UU.) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de entrenamiento de versiones del procesador (UE) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de entrenamiento de versiones del procesador (una sola región) 1 por proyecto Ver cuota en la Google Cloud consola
Versiones de procesadores personalizados implementadas (EE.UU.) 5 por proyecto Ver cuota en la Google Cloud consola
Versiones de procesadores personalizados implementadas (UE) 5 por proyecto Ver cuota en la Google Cloud consola
Versiones de procesadores personalizados implementadas (una sola región) 5 por proyecto Ver cuota en la Google Cloud consola
Versiones de procesadores generativos implementadas (EE.UU.) 100 por proyecto y por procesador de extracción personalizado Ver cuota en la Google Cloud consola
Versiones de procesadores generativos implementadas (UE) 100 por proyecto y por procesador de extracción personalizado Ver cuota en la Google Cloud consola
Versiones de procesadores generativos implementadas (región única) 100 por proyecto y por procesador de extracción personalizado Ver cuota en la Google Cloud consola
Solicitudes simultáneas de importación de documentos (EE.UU.) 3 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de importación de documentos (UE) 3 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de importación de documentos (una sola región) 3 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de exportación de documentos (EE.UU.) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de exportación de documentos (UE) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes simultáneas de exportación de documentos (una sola región) 1 por proyecto Ver cuota en la Google Cloud consola

* Las solicitudes de ajuste de cuota aún no son compatibles con esta versión.

Compatible con australia-southeast1 con una solicitud de ajuste de cuota.

Varía según la versión de Gemini. Consulta los niveles de servicio. Revisa cómo hacer una solicitud de reserva de capacidad.

Si tu proyecto requiere más capacidad, consulta Reservas de capacidad.