En este documento, se detallan las cuotas y los límites del sistema que se aplican a Document AI.
- Las cuotas tienen valores predeterminados, pero, por lo general, puedes solicitar ajustes.
- Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu proyecto de Google Cloud . Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud evitando la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud .
El sistema de cuotas de Cloud lleva a cabo las siguientes acciones:
- Supervisa tu consumo de productos y servicios de Google Cloud
- Restringe el consumo de esos recursos
- Proporciona una forma de solicitar cambios en el valor de la cuota y automatizar los ajustes de la cuota
En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso y la tarea que intentas llevar a cabo falla.
Por lo general, las cuotas se aplican a nivel de proyecto de Google Cloud . El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. En un proyecto de Google Cloud , las cuotas se comparten entre todas las aplicaciones y direcciones IP.
Para obtener más información, consulta la descripción general de cuotas de Cloud.
Para aumentar la capacidad disponible de tus proyectos, lee sobre las solicitudes de reserva de capacidad.
Niveles de servicio en línea
Document AI admite dos niveles de servicio y cuotas asociadas para las solicitudes de procesamiento en línea a las versiones de procesador con tecnología de IA generativa: niveles aprovisionados y de mejor esfuerzo.
La cuota del nivel aprovisionado proporciona 120 páginas por minuto para las versiones de procesador base, como el extractor personalizado v1.4 y v1.5, y 30 páginas por minuto para las versiones de procesador base, como el extractor personalizado v1.5 Pro.
La cuota del nivel de mejor esfuerzo proporciona 120 para las versiones de procesador base, como el extractor personalizado v1.4 y v1.5, 60 para las versiones de procesador Pro, como el extractor personalizado v1.5 Pro, y solo se usa una vez que se agotó la cuota aprovisionada. Esto se aplica a las cuotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (métrica best_effort_online_process_document_pages_us) y BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (métrica best_effort_online_process_document_pages_eu) en la consola.
| Notas | Procesadores basados en Gemini 2.0 Flash | Procesadores basados en Gemini 2.5 Flash | Procesadores basados en Gemini 2.5 Pro |
|---|---|---|---|
| Procesadores como los siguientes: | Extractor personalizado v1.4 | Extractor personalizado v1.5 | Todas las versiones Pro, como el extractor personalizado v1.5 Pro y v1.6 Pro |
| Aprovisionado | 120 | 120 | 30 |
| Mejor esfuerzo | 120 | 120 | 60 |
| Mejor esfuerzo con una solicitud de aumento de cuota | 240 | 240 | 120 |
| Aprovisionado a nivel de la organización | 240 | 240 | 60 |
| Capacidad reservada, comprada | Disponible | Disponible | No disponible |
Si necesitas más de lo que se indica en las cuotas de mejor esfuerzo, puedes enviar una solicitud de aumento de cuota (QIR) comunicándote con el equipo de ventas.
Para garantizar más capacidad disponible durante el tráfico de gran volumen, lee la sección sobre cómo realizar una solicitud de reserva de capacidad.
No hay un acuerdo de nivel de servicio para el nivel de mejor esfuerzo.
Lista de cuotas
Las siguientes cuotas se aplican a Document AI. Estas cuotas se aplican a cada Google Cloud proyecto de la consola y se comparten entre todas las aplicaciones y direcciones IP que usan el proyecto.
Si deseas procesar más solicitudes, envía una solicitud de cuota de Document AI para tu proyecto en la Google Cloud consola.
Proporciona información sobre tus necesidades específicas y tu caso de uso en la solicitud.
| Solicitudes base por minuto (RPM) | Valor predeterminado | Notas |
|---|---|---|
| Solicitudes por minuto | 1,800 por usuario1 | Ver cuota en la Google Cloud consola |
| RPM genérico de sincronización aprovisionado | ||
| Solicitudes de procesamiento en línea por minuto (EE.UU.) | 120 por proyecto por tipo de procesador | Ver cuota en la Google Cloud consola |
| Solicitudes de procesamiento en línea por minuto (UE) | 120 por proyecto por tipo de procesador | Ver cuota en la Google Cloud consola |
| Solicitudes de procesamiento en línea por minuto (una sola región) | 6 por proyecto por tipo de procesador | Ver cuota en la Google Cloud consola |
| PPM de sincronización de IA generativa | ||
| Cantidad de páginas de procesamiento de documentos en línea (EE.UU.) por minuto por tipo de procesador y versión del modelo (solo extractor personalizado v1.4 con Gemini 2.0 Flash) | 120 páginas por minuto2 | Ver cuota en la Google Cloud consola |
| Cantidad de páginas de procesamiento de documentos en línea (UE) por minuto por tipo de procesador y versión del modelo (solo extractor personalizado v1.4 con Gemini 2.0 Flash) | 120 páginas por minuto2 | Ver cuota en la Google Cloud consola |
| Cantidad de páginas de procesamiento de documentos en línea (EE.UU.) por minuto por tipo de procesador y versión del modelo (solo extractor personalizado v1.5 con Gemini 2.5 Flash) | 120 páginas por minuto2 | Ver cuota en la Google Cloud consola |
| Cantidad de páginas de procesamiento de documentos en línea (UE) por minuto por tipo de procesador y versión del modelo (solo extractor personalizado v1.5 con Gemini 2.5 Flash) | 120 páginas por minuto2 | Ver cuota en la Google Cloud consola |
| PPM de sincronización de mejor esfuerzo | ||
| Cantidad de páginas de procesamiento de documentos en línea de mejor esfuerzo (EE.UU.) por minuto por tipo de procesador y versión del modelo | 120 páginas por minuto4 | Ver cuota en la Google Cloud consola |
| Cantidad de páginas de procesamiento de documentos en línea de mejor esfuerzo (UE) por minuto por tipo de procesador y versión del modelo | 120 páginas por minuto4 | Ver cuota en la Google Cloud consola |
| Cantidad de páginas de procesamiento de documentos en línea de mejor esfuerzo (una sola región) por minuto por tipo de procesador y versión del modelo | 120 páginas por minuto4 | Ver cuota en la Google Cloud consola |
| Lotes simultáneos | ||
| Solicitudes de procesamiento por lotes simultáneas por proyecto y región (EE.UU.) | 5 por proyecto | Ver cuota en la Google Cloud consola |
| Solicitudes de procesamiento por lotes simultáneas por proyecto y región (UE) | 5 por proyecto | Ver cuota en la Google Cloud consola |
| Solicitudes de procesamiento por lotes simultáneas por procesador (una sola región) | 5 por proyecto | Ver cuota en la Google Cloud consola |
| Entrenamiento simultáneo | ||
| Solicitudes de entrenamiento de versiones de procesador simultáneas (EE.UU.) | 1 por proyecto | Ver cuota en la Google Cloud consola |
| Solicitudes de entrenamiento de versiones de procesador simultáneas (UE) | 1 por proyecto | Ver cuota en la Google Cloud consola |
| Solicitudes de entrenamiento de versiones de procesador simultáneas (una sola región) | 1 por proyecto3 | Ver cuota en la Google Cloud consola |
| Procesadores implementados | ||
| Versiones de procesador personalizado implementadas (EE.UU.) | 5 por proyecto | Ver cuota en la Google Cloud consola |
| Versiones de procesador personalizado implementadas (UE) | 5 por proyecto | Ver cuota en la Google Cloud consola |
| Versiones de procesador personalizado implementadas (una sola región) | 5 por proyecto | Ver cuota en la Google Cloud consola |
| Procesadores de IA generativa implementados | ||
| Versiones de procesador generativo implementadas (EE.UU.) | 100 por proyecto por procesador de extracción personalizado | Ver cuota en la Google Cloud consola |
| Versiones de procesador generativo implementadas (UE) | 100 por proyecto por procesador de extracción personalizado | Ver cuota en la Google Cloud consola |
| Versiones de procesador generativo implementadas (una sola región) | 100 por proyecto por procesador de extracción personalizado | Ver cuota en la Google Cloud consola |
| Importación simultánea | ||
| Solicitudes de importación de documentos simultáneas (EE.UU.) | 3 por proyecto | Ver cuota en la Google Cloud consola |
| Solicitudes de importación de documentos simultáneas (UE) | 3 por proyecto | Ver cuota en la Google Cloud consola |
| Solicitudes de importación de documentos simultáneas (una sola región) | 3 por proyecto | Ver cuota en la Google Cloud consola |
| Exportación simultánea | ||
| Solicitudes de exportación de documentos simultáneas (EE.UU.) | 1 por proyecto | Ver cuota en la Google Cloud consola |
| Solicitudes de exportación de documentos simultáneas (UE) | 1 por proyecto | Ver cuota en la Google Cloud consola |
| Solicitudes de exportación de documentos simultáneas (una sola región) | 1 por proyecto | Ver cuota en la Google Cloud consola |
- El lote de cuotas de solicitud por minuto es para la cantidad de documentos que se solicitan por minuto, no para la cantidad de páginas ni las llamadas a la API de `batchProcess`.
- Las solicitudes de ajuste de cuota aún no son compatibles con esta versión.
- Se admite en
australia-southeast1con una solicitud de ajuste de cuota. - Varía según la versión de Gemini. Consulta los niveles de servicio. Revisa cómo realizar una solicitud de reserva de capacidad.
Si tu proyecto requiere más capacidad, lee sobre reserva de capacidad.