Cuotas

En este documento, se detallan las cuotas y los límites del sistema que se aplican a Document AI.

  • Las cuotas tienen valores predeterminados, pero, por lo general, puedes solicitar ajustes.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu proyecto de Google Cloud . Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud evitando la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud .

El sistema de cuotas de Cloud lleva a cabo las siguientes acciones:

En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso y la tarea que intentas llevar a cabo falla.

Por lo general, las cuotas se aplican a nivel de proyecto de Google Cloud . El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. En un proyecto de Google Cloud , las cuotas se comparten entre todas las aplicaciones y direcciones IP.

Para obtener más información, consulta la descripción general de cuotas de Cloud.

Para aumentar la capacidad disponible de tus proyectos, lee sobre las solicitudes de reserva de capacidad.

Niveles de servicio en línea

Document AI admite dos niveles de servicio y cuotas asociadas para las solicitudes de procesamiento en línea a las versiones de procesador con tecnología de IA generativa: niveles aprovisionados y de mejor esfuerzo.

La cuota del nivel aprovisionado proporciona 120 páginas por minuto para las versiones de procesador base, como el extractor personalizado v1.4 y v1.5, y 30 páginas por minuto para las versiones de procesador base, como el extractor personalizado v1.5 Pro.

La cuota del nivel de mejor esfuerzo proporciona 120 para las versiones de procesador base, como el extractor personalizado v1.4 y v1.5, 60 para las versiones de procesador Pro, como el extractor personalizado v1.5 Pro, y solo se usa una vez que se agotó la cuota aprovisionada. Esto se aplica a las cuotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (métrica best_effort_online_process_document_pages_us) y BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (métrica best_effort_online_process_document_pages_eu) en la consola.

Notas Procesadores basados en Gemini 2.0 Flash Procesadores basados en Gemini 2.5 Flash Procesadores basados en Gemini 2.5 Pro
Procesadores como los siguientes: Extractor personalizado v1.4 Extractor personalizado v1.5 Todas las versiones Pro, como el extractor personalizado v1.5 Pro y v1.6 Pro
Aprovisionado 120 120 30
Mejor esfuerzo 120 120 60
Mejor esfuerzo con una solicitud de aumento de cuota 240 240 120
Aprovisionado a nivel de la organización 240 240 60
Capacidad reservada, comprada Disponible Disponible No disponible

Si necesitas más de lo que se indica en las cuotas de mejor esfuerzo, puedes enviar una solicitud de aumento de cuota (QIR) comunicándote con el equipo de ventas.

Para garantizar más capacidad disponible durante el tráfico de gran volumen, lee la sección sobre cómo realizar una solicitud de reserva de capacidad.

No hay un acuerdo de nivel de servicio para el nivel de mejor esfuerzo.

Lista de cuotas

Las siguientes cuotas se aplican a Document AI. Estas cuotas se aplican a cada Google Cloud proyecto de la consola y se comparten entre todas las aplicaciones y direcciones IP que usan el proyecto.

Si deseas procesar más solicitudes, envía una solicitud de cuota de Document AI para tu proyecto en la Google Cloud consola.

Proporciona información sobre tus necesidades específicas y tu caso de uso en la solicitud.

Solicitudes base por minuto (RPM) Valor predeterminado Notas
Solicitudes por minuto 1,800 por usuario1 Ver cuota en la Google Cloud consola
RPM genérico de sincronización aprovisionado
Solicitudes de procesamiento en línea por minuto (EE.UU.) 120 por proyecto por tipo de procesador Ver cuota en la Google Cloud consola
Solicitudes de procesamiento en línea por minuto (UE) 120 por proyecto por tipo de procesador Ver cuota en la Google Cloud consola
Solicitudes de procesamiento en línea por minuto (una sola región) 6 por proyecto por tipo de procesador Ver cuota en la Google Cloud consola
PPM de sincronización de IA generativa
Cantidad de páginas de procesamiento de documentos en línea (EE.UU.) por minuto por tipo de procesador y versión del modelo (solo extractor personalizado v1.4 con Gemini 2.0 Flash) 120 páginas por minuto2 Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea (UE) por minuto por tipo de procesador y versión del modelo (solo extractor personalizado v1.4 con Gemini 2.0 Flash) 120 páginas por minuto2 Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea (EE.UU.) por minuto por tipo de procesador y versión del modelo (solo extractor personalizado v1.5 con Gemini 2.5 Flash) 120 páginas por minuto2 Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea (UE) por minuto por tipo de procesador y versión del modelo (solo extractor personalizado v1.5 con Gemini 2.5 Flash) 120 páginas por minuto2 Ver cuota en la Google Cloud consola
PPM de sincronización de mejor esfuerzo
Cantidad de páginas de procesamiento de documentos en línea de mejor esfuerzo (EE.UU.) por minuto por tipo de procesador y versión del modelo 120 páginas por minuto4 Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea de mejor esfuerzo (UE) por minuto por tipo de procesador y versión del modelo 120 páginas por minuto4 Ver cuota en la Google Cloud consola
Cantidad de páginas de procesamiento de documentos en línea de mejor esfuerzo (una sola región) por minuto por tipo de procesador y versión del modelo 120 páginas por minuto4 Ver cuota en la Google Cloud consola
Lotes simultáneos
Solicitudes de procesamiento por lotes simultáneas por proyecto y región (EE.UU.) 5 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de procesamiento por lotes simultáneas por proyecto y región (UE) 5 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de procesamiento por lotes simultáneas por procesador (una sola región) 5 por proyecto Ver cuota en la Google Cloud consola
Entrenamiento simultáneo
Solicitudes de entrenamiento de versiones de procesador simultáneas (EE.UU.) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de entrenamiento de versiones de procesador simultáneas (UE) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de entrenamiento de versiones de procesador simultáneas (una sola región) 1 por proyecto3 Ver cuota en la Google Cloud consola
Procesadores implementados
Versiones de procesador personalizado implementadas (EE.UU.) 5 por proyecto Ver cuota en la Google Cloud consola
Versiones de procesador personalizado implementadas (UE) 5 por proyecto Ver cuota en la Google Cloud consola
Versiones de procesador personalizado implementadas (una sola región) 5 por proyecto Ver cuota en la Google Cloud consola
Procesadores de IA generativa implementados
Versiones de procesador generativo implementadas (EE.UU.) 100 por proyecto por procesador de extracción personalizado Ver cuota en la Google Cloud consola
Versiones de procesador generativo implementadas (UE) 100 por proyecto por procesador de extracción personalizado Ver cuota en la Google Cloud consola
Versiones de procesador generativo implementadas (una sola región) 100 por proyecto por procesador de extracción personalizado Ver cuota en la Google Cloud consola
Importación simultánea
Solicitudes de importación de documentos simultáneas (EE.UU.) 3 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de importación de documentos simultáneas (UE) 3 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de importación de documentos simultáneas (una sola región) 3 por proyecto Ver cuota en la Google Cloud consola
Exportación simultánea
Solicitudes de exportación de documentos simultáneas (EE.UU.) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de exportación de documentos simultáneas (UE) 1 por proyecto Ver cuota en la Google Cloud consola
Solicitudes de exportación de documentos simultáneas (una sola región) 1 por proyecto Ver cuota en la Google Cloud consola
  1. El lote de cuotas de solicitud por minuto es para la cantidad de documentos que se solicitan por minuto, no para la cantidad de páginas ni las llamadas a la API de `batchProcess`.
  2. Las solicitudes de ajuste de cuota aún no son compatibles con esta versión.
  3. Se admite en australia-southeast1 con una solicitud de ajuste de cuota.
  4. Varía según la versión de Gemini. Consulta los niveles de servicio. Revisa cómo realizar una solicitud de reserva de capacidad.

Si tu proyecto requiere más capacidad, lee sobre reserva de capacidad.