Este documento lista as quotas e os limites do sistema que se aplicam ao Document AI.
- As quotas têm valores predefinidos, mas normalmente pode pedir ajustes.
- Os limites do sistema são valores fixos que não podem ser alterados.
Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.
O sistema Cloud Quotas faz o seguinte:
- Monitoriza o seu consumo de Google Cloud produtos e serviços
- Restringe o seu consumo desses recursos
- Oferece uma forma de pedir alterações ao valor da quota e automatizar os ajustes de quotas
Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.
Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.
Este documento lista as quotas que se aplicam à IA Documental.
Níveis de serviço
O Document AI suporta dois níveis de serviço e quotas associadas para pedidos de processamento online para versões de processadores com tecnologia de IA generativa: níveis aprovisionados e de melhor esforço.
A quota do nível aprovisionado oferece 120 páginas por minuto para versões do processador base, como o extrator personalizado v1.4 e v1.5, e 30 páginas por minuto para versões do processador base, como o extrator personalizado v1.5 Pro.
A quota de nível de melhor esforço oferece 120 para versões de processador base, como o extrator personalizado v1.4 e v1.5, 60 para versões de processador Pro, como o extrator personalizado v1.5 Pro, e só é usada quando a quota aprovisionada se esgota. Isto aplica-se às
quotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(métrica best_effort_online_process_document_pages_us
) e
BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(métrica best_effort_online_process_document_pages_eu
) na consola.
Notas | Extrator personalizado v1.4 (com base no Gemini 2.0 Flash) | Extrator personalizado v1.5 (com base no Gemini 2.5 Flash) | Extrator personalizado v1.5 Pro (com base no Gemini 2.5 Pro) |
---|---|---|---|
Aprovisionado | 120 | 120 | 30 |
Dentro do possível | 120 | 120 | 60 |
Aprovisionado ao nível da organização | 240 | 240 | 60 |
Se precisar de mais do que as quotas de melhor esforço indicadas, pode fazer um pedido de aumento de quota (QIR) contactando a equipa de vendas.
Para garantir mais capacidade disponível durante o tráfego de elevado volume, leia a secção sobre como fazer um pedido de reserva de capacidade.
Não existe um contrato de nível de serviço para o nível de melhor esforço.
Lista de quotas
As seguintes quotas aplicam-se à IA Documental. Estas quotas aplicam-se a cada Google Cloud projeto da consola e são partilhadas em todas as aplicações e endereços IP que usam esse projeto.
Se quiser processar mais pedidos, envie um pedido de quota da IA Documental para o seu projeto na Google Cloud consola.
Forneça informações sobre as suas necessidades específicas e exemplo de utilização no pedido.
Pedir quota | Valor predefinido | Notas |
---|---|---|
Pedidos por minuto | 1800 por utilizador | Veja a quota na Google Cloud consola |
Processar pedidos online por minuto (EUA) | 120 por projeto por tipo de processador | Veja a quota na Google Cloud consola |
Processar pedidos online por minuto (UE) | 120 por projeto por tipo de processador | Veja a quota na Google Cloud consola |
Número de páginas de documentos de processamento online (EUA) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.4 apenas com o Gemini 2.0 Flash) | 120 páginas por minuto* | Veja a quota na Google Cloud consola |
Número de páginas de documentos de processamento online (UE) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.4 apenas com o Gemini 2.0 Flash) | 120 páginas por minuto* | Veja a quota na Google Cloud consola |
Número de páginas de documentos de processamento online (EUA) por minuto por tipo de processador e versão do modelo (Custom Extractor v1.5 apenas com o Gemini 2.5 Flash) | 120 páginas por minuto* | Veja a quota na Google Cloud consola |
Número de páginas de documentos de processamento online (UE) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.5 apenas com o Gemini 2.5 Flash) | 120 páginas por minuto* | Veja a quota na Google Cloud consola |
Processar pedidos online por minuto (região única) | 6 por projeto por tipo de processador | Veja a quota na Google Cloud consola |
Pedidos de processamento em lote simultâneos por projeto e região (EUA) | 5 por projeto | Veja a quota na Google Cloud consola |
Pedidos de processamento em lote simultâneos por projeto e região (UE) | 5 por projeto | Veja a quota na Google Cloud consola |
Pedidos de processamento em lote simultâneos por processador (região única) | 5 por projeto | Veja a quota na Google Cloud consola |
Pedidos de preparação da versão do processador concorrente (EUA) | 1 por projeto | Veja a quota na Google Cloud consola |
Pedidos de preparação da versão do processador simultâneos (UE) | 1 por projeto | Veja a quota na Google Cloud consola |
Pedidos de preparação da versão do processador simultâneos (região única) | 1 por projeto† | Veja a quota na Google Cloud consola |
Versões do processador personalizado implementadas (EUA) | 5 por projeto | Veja a quota na Google Cloud consola |
Versões do processador personalizado implementadas (UE) | 5 por projeto | Veja a quota na Google Cloud consola |
Versões do processador personalizado implementadas (região única) | 5 por projeto | Veja a quota na Google Cloud consola |
Versões do processador generativo implementadas (EUA) | 100 por projeto por processador de extração personalizado | Veja a quota na Google Cloud consola |
Versões do processador generativo implementadas (UE) | 100 por projeto por processador de extração personalizado | Veja a quota na Google Cloud consola |
Versões de processadores generativos implementadas (região única) | 100 por projeto por processador de extração personalizado | Veja a quota na Google Cloud consola |
Pedidos de documentos de importação simultâneos (EUA) | 3 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de importação simultâneos (UE) | 3 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de importação simultâneos (região única) | 3 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de exportação simultâneos (EUA) | 1 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de exportação simultâneos (UE) | 1 por projeto | Veja a quota na Google Cloud consola |
Pedidos de documentos de exportação simultâneos (região única) | 1 por projeto | Veja a quota na Google Cloud consola |
* Os pedidos de ajuste de quota ainda não são suportados para esta versão.
† Suportado no australia-southeast1
com um pedido de ajuste de quota.
Faça um pedido de reserva de capacidade
A reserva de capacidade da IA Documental oferece capacidade reservada para publicar tráfego de previsão em tempo real e de elevado volume durante o período subscrito, o que ajuda a cumprir os requisitos do contrato de nível de serviço (SLA). Cada unidade corresponde a uma página por minuto adicional além da quota predefinida.
A reserva de capacidade é suportada e necessária para aumentar as quotas de nível aprovisionado dos modelos de extrator personalizado v1.4 e v1.5, incluindo versões de processadores otimizadas com base neles.
O preço da reserva de capacidade é de 300 USD por cada página adicional por minuto por mês.
Para fazer um pedido de reserva de capacidade:
Na Google Cloud consola, aceda à página IAM e administração > Reserva de capacidade:
Junto ao cabeçalho da página, clique em Criar nova reserva de capacidade. Esta ação abre um formulário de pedido de duas páginas.
Preencha a página Configurar com o seguinte:
- Preencha um nome para o pedido.
- Selecione uma região.
- Selecione a versão do processador no menu pendente.
- Indique o número de páginas adicionais por minuto necessárias por mês.
- Selecione o prazo da subscrição mensal.
- Selecione a data e a hora de início.
- Selecione uma opção de renovação automática no menu pendente.
Clique em Continuar.
Na segunda página, é apresentado um custo estimado por mês. Para validar a compra, introduza Confirmar.
Clique em Confirmar e enviar.
Pode ver o estado do pedido no separador Reserva de capacidade.
Os três estados possíveis incluem:
- Inativo: a subscrição ainda não começou.
- Ativa: a subscrição está em curso.
- Concluído: a subscrição terminou.
Aspetos a considerar antes de comprar uma reserva de capacidade
Para ajudar a decidir se quer comprar uma reserva de capacidade, considere o seguinte:
Não pode cancelar a encomenda a meio do prazo.
A compra de uma reserva de capacidade é um compromisso, o que significa que não pode cancelar a encomenda a meio do prazo. No entanto, pode aumentar o número de GSUs compradas. Se comprar acidentalmente um compromisso ou ocorrer um problema com a configuração, contacte o seu Google Cloud representante da conta para receber assistência.
Pode renovar automaticamente a sua subscrição.
Quando envia a sua encomenda, pode optar por renovar automaticamente a subscrição no final do respetivo período ou deixar que a subscrição expire. Pode cancelar o processo de renovação automática. Para cancelar a sua subscrição antes da renovação automática, cancele a renovação automática 30 dias antes do início do período seguinte.
Pode configurar as subscrições mensais para serem renovadas automaticamente todos os meses. Os termos semanais não suportam a renovação automática.