Quotas

Este documento lista as quotas e os limites do sistema que se aplicam ao Document AI.

  • As quotas têm valores predefinidos, mas normalmente pode pedir ajustes.
  • Os limites do sistema são valores fixos que não podem ser alterados.

Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.

O sistema Cloud Quotas faz o seguinte:

Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.

Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.

Este documento lista as quotas que se aplicam à IA Documental.

Níveis de serviço

O Document AI suporta dois níveis de serviço e quotas associadas para pedidos de processamento online para versões de processadores com tecnologia de IA generativa: níveis aprovisionados e de melhor esforço.

A quota do nível aprovisionado oferece 120 páginas por minuto para versões do processador base, como o extrator personalizado v1.4 e v1.5, e 30 páginas por minuto para versões do processador base, como o extrator personalizado v1.5 Pro.

A quota de nível de melhor esforço oferece 120 para versões de processador base, como o extrator personalizado v1.4 e v1.5, 60 para versões de processador Pro, como o extrator personalizado v1.5 Pro, e só é usada quando a quota aprovisionada se esgota. Isto aplica-se às quotas BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (métrica best_effort_online_process_document_pages_us) e BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (métrica best_effort_online_process_document_pages_eu) na consola.

Notas Extrator personalizado v1.4 (com base no Gemini 2.0 Flash) Extrator personalizado v1.5 (com base no Gemini 2.5 Flash) Extrator personalizado v1.5 Pro (com base no Gemini 2.5 Pro)
Aprovisionado 120 120 30
Dentro do possível 120 120 60
Aprovisionado ao nível da organização 240 240 60

Se precisar de mais do que as quotas de melhor esforço indicadas, pode fazer um pedido de aumento de quota (QIR) contactando a equipa de vendas.

Para garantir mais capacidade disponível durante o tráfego de elevado volume, leia a secção sobre como fazer um pedido de reserva de capacidade.

Não existe um contrato de nível de serviço para o nível de melhor esforço.

Lista de quotas

As seguintes quotas aplicam-se à IA Documental. Estas quotas aplicam-se a cada Google Cloud projeto da consola e são partilhadas em todas as aplicações e endereços IP que usam esse projeto.

Se quiser processar mais pedidos, envie um pedido de quota da IA Documental para o seu projeto na Google Cloud consola.

Forneça informações sobre as suas necessidades específicas e exemplo de utilização no pedido.

Pedir quota Valor predefinido Notas
Pedidos por minuto 1800 por utilizador Veja a quota na Google Cloud consola
Processar pedidos online por minuto (EUA) 120 por projeto por tipo de processador Veja a quota na Google Cloud consola
Processar pedidos online por minuto (UE) 120 por projeto por tipo de processador Veja a quota na Google Cloud consola
Número de páginas de documentos de processamento online (EUA) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.4 apenas com o Gemini 2.0 Flash) 120 páginas por minuto* Veja a quota na Google Cloud consola
Número de páginas de documentos de processamento online (UE) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.4 apenas com o Gemini 2.0 Flash) 120 páginas por minuto* Veja a quota na Google Cloud consola
Número de páginas de documentos de processamento online (EUA) por minuto por tipo de processador e versão do modelo (Custom Extractor v1.5 apenas com o Gemini 2.5 Flash) 120 páginas por minuto* Veja a quota na Google Cloud consola
Número de páginas de documentos de processamento online (UE) por minuto por tipo de processador e versão do modelo (extrator personalizado v1.5 apenas com o Gemini 2.5 Flash) 120 páginas por minuto* Veja a quota na Google Cloud consola
Processar pedidos online por minuto (região única) 6 por projeto por tipo de processador Veja a quota na Google Cloud consola
Pedidos de processamento em lote simultâneos por projeto e região (EUA) 5 por projeto Veja a quota na Google Cloud consola
Pedidos de processamento em lote simultâneos por projeto e região (UE) 5 por projeto Veja a quota na Google Cloud consola
Pedidos de processamento em lote simultâneos por processador (região única) 5 por projeto Veja a quota na Google Cloud consola
Pedidos de preparação da versão do processador concorrente (EUA) 1 por projeto Veja a quota na Google Cloud consola
Pedidos de preparação da versão do processador simultâneos (UE) 1 por projeto Veja a quota na Google Cloud consola
Pedidos de preparação da versão do processador simultâneos (região única) 1 por projeto Veja a quota na Google Cloud consola
Versões do processador personalizado implementadas (EUA) 5 por projeto Veja a quota na Google Cloud consola
Versões do processador personalizado implementadas (UE) 5 por projeto Veja a quota na Google Cloud consola
Versões do processador personalizado implementadas (região única) 5 por projeto Veja a quota na Google Cloud consola
Versões do processador generativo implementadas (EUA) 100 por projeto por processador de extração personalizado Veja a quota na Google Cloud consola
Versões do processador generativo implementadas (UE) 100 por projeto por processador de extração personalizado Veja a quota na Google Cloud consola
Versões de processadores generativos implementadas (região única) 100 por projeto por processador de extração personalizado Veja a quota na Google Cloud consola
Pedidos de documentos de importação simultâneos (EUA) 3 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de importação simultâneos (UE) 3 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de importação simultâneos (região única) 3 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de exportação simultâneos (EUA) 1 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de exportação simultâneos (UE) 1 por projeto Veja a quota na Google Cloud consola
Pedidos de documentos de exportação simultâneos (região única) 1 por projeto Veja a quota na Google Cloud consola

* Os pedidos de ajuste de quota ainda não são suportados para esta versão.

Suportado no australia-southeast1 com um pedido de ajuste de quota.

Faça um pedido de reserva de capacidade

A reserva de capacidade da IA Documental oferece capacidade reservada para publicar tráfego de previsão em tempo real e de elevado volume durante o período subscrito, o que ajuda a cumprir os requisitos do contrato de nível de serviço (SLA). Cada unidade corresponde a uma página por minuto adicional além da quota predefinida.

A reserva de capacidade é suportada e necessária para aumentar as quotas de nível aprovisionado dos modelos de extrator personalizado v1.4 e v1.5, incluindo versões de processadores otimizadas com base neles.

O preço da reserva de capacidade é de 300 USD por cada página adicional por minuto por mês.

Para fazer um pedido de reserva de capacidade:

  1. Na Google Cloud consola, aceda à página IAM e administração > Reserva de capacidade:

    Reserva de capacidade

  2. Junto ao cabeçalho da página, clique em Criar nova reserva de capacidade. Esta ação abre um formulário de pedido de duas páginas.

  3. Preencha a página Configurar com o seguinte:

    • Preencha um nome para o pedido.
    • Selecione uma região.
    • Selecione a versão do processador no menu pendente.
    • Indique o número de páginas adicionais por minuto necessárias por mês.
    • Selecione o prazo da subscrição mensal.
    • Selecione a data e a hora de início.
    • Selecione uma opção de renovação automática no menu pendente.
  4. Clique em Continuar.

  5. Na segunda página, é apresentado um custo estimado por mês. Para validar a compra, introduza Confirmar.

  6. Clique em Confirmar e enviar.

Pode ver o estado do pedido no separador Reserva de capacidade.

Os três estados possíveis incluem:

  • Inativo: a subscrição ainda não começou.
  • Ativa: a subscrição está em curso.
  • Concluído: a subscrição terminou.

Aspetos a considerar antes de comprar uma reserva de capacidade

Para ajudar a decidir se quer comprar uma reserva de capacidade, considere o seguinte:

  • Não pode cancelar a encomenda a meio do prazo.

    A compra de uma reserva de capacidade é um compromisso, o que significa que não pode cancelar a encomenda a meio do prazo. No entanto, pode aumentar o número de GSUs compradas. Se comprar acidentalmente um compromisso ou ocorrer um problema com a configuração, contacte o seu Google Cloud representante da conta para receber assistência.

  • Pode renovar automaticamente a sua subscrição.

    Quando envia a sua encomenda, pode optar por renovar automaticamente a subscrição no final do respetivo período ou deixar que a subscrição expire. Pode cancelar o processo de renovação automática. Para cancelar a sua subscrição antes da renovação automática, cancele a renovação automática 30 dias antes do início do período seguinte.

    Pode configurar as subscrições mensais para serem renovadas automaticamente todos os meses. Os termos semanais não suportam a renovação automática.