En este documento se indican las cuotas y los límites del sistema que se aplican a Document AI.
- Las cuotas tienen valores predeterminados, pero normalmente puedes solicitar ajustes.
- Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de unGoogle Cloud recurso que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una serie de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir el número de llamadas a una API enviadas a un servicio, el número de balanceadores de carga que usa tu proyecto de forma simultánea o el número de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud al evitar que se sobrecarguen los servicios. Las cuotas también te ayudan a gestionar tus propios recursos. Google Cloud
El sistema de cuotas de Cloud hace lo siguiente:
- Monitoriza tu consumo de Google Cloud productos y servicios
- Restringe el consumo de esos recursos
- Proporciona una forma de solicitar cambios en el valor de la cuota y automatizar los ajustes de la cuota.
En la mayoría de los casos, cuando intentas consumir más recursos de los que permite la cuota, el sistema bloquea el acceso al recurso y la tarea que intentas realizar falla.
Las cuotas se aplican generalmente a nivel de Google Cloud proyecto. El uso que hagas de un recurso en un proyecto no afectará a la cuota disponible en otro proyecto. En un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
En este documento se indican las cuotas que se aplican a Document AI.
Niveles de servicio
Document AI admite dos niveles de servicio y las cuotas asociadas para las solicitudes de proceso online a las versiones de procesador basadas en IA generativa: los niveles aprovisionado y de mejor esfuerzo.
La cuota del nivel aprovisionado es de 120 páginas por minuto para las versiones del procesador base, como el extractor personalizado v1.4 y v1.5, y de 30 páginas por minuto para las versiones del procesador base, como el extractor personalizado v1.5 Pro.
La cuota de nivel de mejor esfuerzo proporciona 120 para las versiones del procesador base, como el extractor personalizado v1.4 y v1.5, y 60 para las versiones del procesador Pro, como el extractor personalizado v1.5 Pro. Solo se usa una vez que se ha agotado la cuota aprovisionada. Esto se aplica a las cuotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(métrica best_effort_online_process_document_pages_us
) y BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(métrica best_effort_online_process_document_pages_eu
) de la consola.
Notas | Extractor personalizado v1.4 (basado en Gemini 2.0 Flash) | Extractor personalizado v1.5 (basado en Gemini 2.5 Flash) | Extractor personalizado v1.5 Pro (basado en Gemini 2.5 Pro) |
---|---|---|---|
Aprovisionado | 120 | 120 | 30 |
Lo antes posible | 120 | 120 | 60 |
Aprovisionamiento a nivel de organización | 240 | 240 | 60 |
Si necesitas más cuota de la que se indica en la sección de cuotas de mejor esfuerzo, puedes enviar una solicitud de aumento de cuota poniéndote en contacto con el equipo de Ventas.
Para asegurar una mayor capacidad disponible durante los periodos de mucho tráfico, consulta la sección sobre cómo enviar una solicitud de reserva de capacidad.
No hay ningún acuerdo de nivel de servicio para el nivel de mejor esfuerzo.
Lista de cuotas
Las siguientes cuotas se aplican a Document AI. Estas cuotas se aplican a cada proyecto de la consola Google Cloud y se comparten entre todas las aplicaciones y direcciones IP que utilizan ese proyecto.
Si quieres procesar más solicitudes, envía una solicitud de cuota de Document AI para tu proyecto en la Google Cloud consola.
En la solicitud, proporciona información sobre tus necesidades específicas y tu caso práctico.
Cuota de solicitudes | Valor predeterminado | Notas |
---|---|---|
Solicitudes por minuto | 1800 por usuario | Ver la cuota en la consola de Google Cloud |
Solicitudes de procesos online por minuto (EE. UU.) | 120 por proyecto y tipo de procesador | Ver la cuota en la consola de Google Cloud |
Solicitudes de procesos online por minuto (UE) | 120 por proyecto y tipo de procesador | Ver la cuota en la consola de Google Cloud |
Número de páginas de documentos de proceso online (EE. UU.) por minuto, tipo de procesador y versión del modelo (solo Extractor personalizado v1.4 con Gemini 2.0 Flash) | 120 páginas por minuto* | Ver la cuota en la consola de Google Cloud |
Número de páginas de documentos procesados online (UE) por minuto, tipo de procesador y versión del modelo (solo Extractor personalizado v1.4 con Gemini 2.0 Flash) | 120 páginas por minuto* | Ver la cuota en la consola de Google Cloud |
Número de páginas de documentos procesados online (EE. UU.) por minuto y por tipo de procesador y versión del modelo (solo Extractor personalizado v1.5 con Gemini 2.5 Flash) | 120 páginas por minuto* | Ver la cuota en la consola de Google Cloud |
Número de páginas de documentos procesados online (UE) por minuto, tipo de procesador y versión del modelo (solo Extractor personalizado v1.5 con Gemini 2.5 Flash) | 120 páginas por minuto* | Ver la cuota en la consola de Google Cloud |
Solicitudes de proceso online por minuto (una sola región) | 6 por proyecto y tipo de procesador | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de procesos por lotes por proyecto y región (EE. UU.) | 5 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de procesos por lotes por proyecto y región (UE) | 5 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de procesamiento por lotes por procesador (una sola región) | 5 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de entrenamiento de versiones de procesador (EE. UU.) | 1 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de entrenamiento de versiones de procesador (UE) | 1 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de entrenamiento de versiones de procesadores (una sola región) | 1 por proyecto† | Ver la cuota en la consola de Google Cloud |
Versiones de procesadores personalizados desplegadas (EE. UU.) | 5 por proyecto | Ver la cuota en la consola de Google Cloud |
Versiones de procesadores personalizados desplegadas (UE) | 5 por proyecto | Ver la cuota en la consola de Google Cloud |
Versiones de procesador personalizado desplegadas (una sola región) | 5 por proyecto | Ver la cuota en la consola de Google Cloud |
Versiones de procesador generativo desplegadas (EE. UU.) | 100 por proyecto y procesador de extracción personalizado | Ver la cuota en la consola de Google Cloud |
Versiones de procesador generativas desplegadas (UE) | 100 por proyecto y procesador de extracción personalizado | Ver la cuota en la consola de Google Cloud |
Versiones de procesador generativas implementadas (una sola región) | 100 por proyecto y procesador de extracción personalizado | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de importación de documentos (EE. UU.) | 3 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de importación de documentos (UE) | 3 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de importación de documentos (una sola región) | 3 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de exportación de documentos (EE. UU.) | 1 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de exportación de documentos (UE) | 1 por proyecto | Ver la cuota en la consola de Google Cloud |
Solicitudes simultáneas de exportación de documentos (una sola región) | 1 por proyecto | Ver la cuota en la consola de Google Cloud |
* Las solicitudes de ajuste de cuota aún no se admiten en esta versión.
† Se admite en australia-southeast1
con una solicitud de ajuste de cuota.
Hacer una solicitud de reserva de capacidad
La reserva de capacidad de Document AI proporciona capacidad reservada para atender el tráfico de predicción de alto volumen en tiempo real durante el periodo suscrito, lo que ayuda a cumplir los requisitos del acuerdo de nivel de servicio. Cada unidad corresponde a una página adicional por minuto que supera la cuota predeterminada.
La reserva de capacidad es compatible y obligatoria para aumentar las cuotas de nivel aprovisionado de los modelos de extractor personalizado de las versiones 1.4 y 1.5, incluidas las versiones de procesador ajustadas basadas en ellos.
El precio de la reserva de capacidad es de 300 USD por cada página adicional por minuto al mes.
Para enviar una solicitud de reserva de capacidad, sigue estos pasos:
En la Google Cloud consola, ve a la página IAM y administración > Reserva de capacidad:
Cerca del encabezado de la página, haz clic en Crear reserva de capacidad. Se te redirigirá a un formulario de solicitud de dos páginas.
Rellena la página Configurar con la siguiente información:
- Escriba un nombre para el pedido.
- Selecciona una región.
- Selecciona la versión del procesador en el menú desplegable.
- Escribe el número de páginas adicionales por minuto que necesitas al mes.
- Selecciona el periodo de suscripción mensual.
- Selecciona la fecha y la hora de inicio.
- Selecciona una opción de renovación automática en el menú desplegable.
Haz clic en Continuar.
En la segunda página, verás un coste estimado al mes. Para validar la compra, introduce Confirmar.
Haz clic en Confirmar y enviar.
Podrás ver el estado de la solicitud en la pestaña Reserva de capacidad.
Los tres estados posibles son los siguientes:
- Inactiva: la suscripción aún no ha empezado.
- Activa: la suscripción está en curso.
- Completada: la suscripción ha finalizado.
Qué debes tener en cuenta antes de comprar una reserva de capacidad
Para ayudarte a decidir si quieres comprar una reserva de capacidad, ten en cuenta lo siguiente:
No puedes cancelar tu pedido a mitad del periodo.
La compra de una reserva de capacidad es un compromiso, lo que significa que no puedes cancelar el pedido durante el periodo. Sin embargo, puedes aumentar el número de GSUs compradas. Si compras por error un compromiso o hay algún problema con tu configuración, ponte en contacto con tu Google Cloud representante de cuenta para obtener ayuda.
Puedes renovar tu suscripción automáticamente.
Cuando envíes tu pedido, podrás elegir si quieres que tu suscripción se renueve automáticamente al final del periodo o si quieres que caduque. Puedes cancelar el proceso de renovación automática. Para cancelar tu suscripción antes de que se renueve automáticamente, cancela la renovación automática 30 días antes del inicio del siguiente periodo.
Puedes configurar las suscripciones mensuales para que se renueven automáticamente cada mes. Los términos semanales no admiten la renovación automática.