Lista de processadores
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Esta página contém informações detalhadas sobre todos os processadores oferecidos pela
Document AI. Confira uma lista de todos os processadores por tipo de solução.
Enterprise Document OCR (reconhecimento óptico de caracteres)
Descrição
Identificar e extrair texto em diferentes tipos de documentos.
Esse processador permite identificar e extrair texto, incluindo texto manuscrito, de documentos em mais de 200 idiomas. O processador também usa o aprendizado de máquina para fazer uma avaliação da qualidade de um documento com base na legibilidade do conteúdo.
Versão congelada do modelo v1.0: arquivos, configurações e binários de um snapshot de versão congelados em uma imagem de contêiner por até 18 meses.
pretrained-ocr-v2.0-2023-06-02
Estável
GA
Modelo pronto para Production especializado em casos de uso de documentos. Inclui acesso a todos os complementos de OCR.
pretrained-ocr-v2.1-2024-08-07
Estável
GA
As principais áreas de melhoria da v2.1 são: melhor reconhecimento de texto impresso, detecção mais precisa de caixas de seleção e ordem de leitura mais precisa.
pretrained-ocr-v2.1.1-2025-01-31
Versão candidata
Prévia pública
A v2.1.1 é semelhante à v2.1 e está disponível em todas as regiões, exceto: US, EU e asia-southeast1.
A disponibilidade por região está em US, EU, northamerica-northeast1 e asia-southeast1.
Idiomas disponíveis
Lista completa de idiomas
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Africâner
af
Latn
Árabe
ar
Arab
Azerbaijano
az
Latn
Azerbaijano (cirílico)
az-Cyrl
Cyrl
Bielorrusso
be
Cyrl
Búlgaro
bg
Cyrl
Bósnio
bs
Latn
Catalão
ca
Latn
Cebuano
ceb
Latn
Tcheco
cs
Latn
Galês
cy
Latn
Dinamarquês
da
Latn
Alemão
de
Latn
Grego
el
Grek
Inglês
en
Latn
Esperanto
eo
Latn
Espanhol
es
Latn
Estoniano
et
Latn
Basco
eu
Latn
Persa
fa
Arab
Finlandês
fi
Latn
Filipino
fil
Latn
Francês
fr
Latn
Irlandês
ga
Latn
Galego
gl
Latn
Hindi
hi
Deva
Croata
hr
Latn
Crioulo haitiano
ht
Latn
Húngaro
hu
Latn
Indonésio
id
Latn
Islandês
is
Latn
Italiano
it
Latn
Hebraico
iw
Hebr
Japonês
ja
Jpan
Javanês
jv
Latn
Cazaque
kk
Cyrl
Coreano
ko
Kore
Quirguiz
ky
Cyrl
Latim
la
Latn
Lituano
lt
Latn
Letão
lv
Latn
Macedônio
mk
Cyrl
Mongol
mn
Cyrl
Marati
mr
Deva
Malaio
ms
Latn
Maltês
mt
Latn
Nepalês
ne
Deva
Holandês
nl
Latn
Norueguês
no
Latn
Polonês
pl
Latn
Pastó
ps
Arab
Português (Portugal e Brasil)
pt
Latn
Romeno
ro
Latn
Russo
ru
Cyrl
Russo (ortografia petrina)
ru-PETR1708
Cyrl
Sânscrito
sa
Deva
Eslovaco
sk
Latn
Esloveno
sl
Latn
Albanês
sq
Latn
Sérvio
sr
Cyrl
Sueco
sv
Latn
Suaíli
sw
Latn
Tagalo
tl
Latn
Turco
tr
Latn
Ucraniano
uk
Cyrl
Urdu
ur
Arab
Uzbeque
uz
Latn
Usbeque (cirílico)
uz-Cyrl
Cyrl
Vietnamita
vi
Latn
Ídiche
yi
Hebr
Chinês simplificado
zh-Hans
Hani
Chinês tradicional
zh-Hant
Hani
Zulu
zu
Latn
Versões do processador
ID da versão
Canal de lançamento
Nível de maturidade da versão
Descrição
pretrained-foundation-model-v1.4-2025-02-05
Estável
GA
Modelo GA com tecnologia do LLM Gemini 2.0 Flash. Também inclui recursos avançados de OCR, como detecção de caixas de seleção.
pretrained-foundation-model-v1.5-2025-05-05
Estável
GA
Candidato pronto para Production com tecnologia do LLM Gemini 2.5 Flash. Recomendado para quem quer testar modelos mais recentes.
pretrained-foundation-model-v1.5-pro-2025-06-20
Estável
GA
Modelo pronto para Production com tecnologia do LLM Gemini 2.5 Pro. Suporta uma cota de até 30 páginas por minuto para solicitações de processo on-line. Esse modelo tem qualidade melhorada em comparação com a v1.5 e pode ter uma latência maior.
pretrained-foundation-model-v1.5.1-2025-08-07
Versão candidata
Prévia pública
Modelo de pré-lançamento público com tecnologia do LLM Gemini 2.5 Flash. Esse modelo tem os mesmos recursos da v1.5 e melhorou o aprendizado adaptativo de poucos disparos.
Extrair pares de chave-valor gerais (entidade e caixa de seleção), tabelas e entidades genéricas de documentos, além de texto de OCR.
Esse processador aplica tecnologias avançadas de aprendizado de máquina para extrair pares de chave-valor, caixas de seleção e tabelas de documentos em mais de 200 idiomas. Esse processador também usa modelos de aprendizado profundo para extrair 11 entidades genéricas comuns em vários tipos de documentos.
Categoria
Extrair
Funções
OCR, análise de formulários, extração de entidades
Extrai elementos de conteúdo de documentos (texto, tabelas e listas) e cria blocos com reconhecimento de contexto.
O analisador de layout extrai elementos de conteúdo de documentos, como texto, tabelas e listas, e cria blocos com reconhecimento de contexto que facilitam a recuperação de informações em IA generativa e aplicativos de descoberta.
Esse analisador é compatível com arquivos PDF, HTML, DOCX, PPTX e XLSX/XLSM.
Idiomas disponíveis
Lista completa de idiomas
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Africâner
af
Latn
Albanês
sq
Latn
Árabe
ar
Arab
Armênio
hy
Armn
Bielorrusso
be
Cyrl
Bengali
bn
Beng
Bengalês
bn
Beng
Búlgaro
bg
Cyrl
Catalão
ca
Latn
Chinês
zh
Hani
Croata
hr
Latn
Tcheco
cs
Latn
Dinamarquês
da
Latn
Holandês
nl
Latn
Inglês
en
Latn
Estoniano
et
Latn
Filipino
fil
Latn
Finlandês
fi
Latn
Francês
fr
Latn
Alemão
de
Latn
Grego
el
Grek
Gujarati
gu
Gujr
Hebraico
iw
Hebr
Hindi
hi
Deva
Húngaro
hu
Latn
Islandês
is
Latn
Indonésio
id
Latn
Italiano
it
Latn
Japonês
ja
Jpan
Canarês
kn
Knda
Khmer
km
Khmr
Coreano
ko
Kore
Laosiano
lo
Laoo
Letão
lv
Latn
Lituano
lt
Latn
Macedônio
mk
Cyrl
Malaio
ms
Latn
Malaiala
ml
Mlym
Marati
mr
Deva
Nepalês
ne
Deva
Norueguês
no
Latn
Persa
fa
Arab
Polonês
pl
Latn
Português (Portugal e Brasil)
pt
Latn
Punjabi
pa
Guru
Romeno
ro
Latn
Russo
ru
Cyrl
Sérvio
sr
Cyrl
Eslovaco
sk
Latn
Esloveno
sl
Latn
Espanhol
es
Latn
Sueco
sv
Latn
Tagalo
tl
Latn
Tâmil
ta
Taml
Télugo
te
Telu
Tailandês
th
Thai
Turco
tr
Latn
Ucraniano
uk
Cyrl
Vietnamita
vi
Latn
Ídiche
yi
Hebr
Versões do processador
ID da versão
Canal de lançamento
Nível de maturidade da versão
Descrição
pretrained-layout-parser-v1.0-2024-06-03
Estável
GA
Versão de disponibilidade geral para análise de layout de documentos. Essa é a versão padrão do processador pré-treinado.
pretrained-layout-parser-v1.5-2025-08-25
Versão candidata a lançamento
Prévia pública
Versão de pré-lançamento com tecnologia do LLM Gemini 2.5 Flash para melhor análise de layout em arquivos PDF. Recomendado para quem quer testar novas versões. Se for usado para arquivos que não são PDF, ele terá o mesmo comportamento do pretrained-layout-parser-v1.0-2024-06-03 estável.
pretrained-layout-parser-v1.5-pro-2025-08-25
Versão candidata a lançamento
Prévia pública
Versão de pré-lançamento com tecnologia do LLM Gemini 2.5 Pro para melhor análise de layout em arquivos PDF. A v1.5-pro tem uma latência maior do que a v1.5. Se for usado para arquivos que não são PDF, ele terá o mesmo comportamento da v1.0 estável.
Se uma página de um arquivo de entrada de várias páginas for o tipo de documento correto e uma das versões compatíveis, o processador vai realizar a extração de entidades no primeiro documento compatível. Se o processador não encontrar documentos aplicáveis no arquivo de entrada, ele vai retornar uma mensagem de erro.
Idiomas disponíveis
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Inglês
en
Latn
Versões do processador
ID da versão
Canal de lançamento
Nível de maturidade da versão
Descrição
pretrained-bankstatement-v1.0-2021-08-08
Estável
GA
pretrained-bankstatement-v1.1-2021-08-13
Estável
GA
pretrained-bankstatement-v2.0-2021-12-10
Estável
GA
pretrained-bankstatement-v3.0-2022-05-16
Estável
GA
Esta versão pressupõe que o arquivo de entrada contém um único extrato bancário. Ao contrário da versão padrão, essa versão não verifica o arquivo de entrada em busca de extratos bancários e não retorna um erro se nenhum for encontrado.
Se uma página de um arquivo de entrada de várias páginas for o tipo de documento correto e uma das versões compatíveis, o processador vai realizar a extração de entidades no primeiro documento compatível. Se o processador não encontrar documentos aplicáveis no arquivo de entrada, ele vai retornar uma mensagem de erro.
Idiomas disponíveis
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Inglês
en
Latn
Formulários/versões compatíveis
2020 (versões padrão e personalizadas)
2019 (versões padrão e personalizadas)
2018 (versões padrão e personalizadas)
Versões do processador
ID da versão
Canal de lançamento
Nível de maturidade da versão
Outros campos detectados
Descrição
pretrained-w2-v1.0-2020-10-01
Estável
GA
Nenhum
pretrained-w2-v1.1-2022-01-27
Estável
GA
Nenhum
pretrained-w2-v1.2-2022-01-28
Estável
GA
Mostrar campos
AllocatedTips
ControlNumber
DependentCareBenefits
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
EmployerStateIdNumber_Line1
FederalIncomeTaxWithheld
FormYear
LocalIncomeTax_Line1
LocalityName_Line1
LocalWagesTipsEtc_Line1
MedicareTaxWithheld
MedicareWagesAndTips
NonqualifiedPlans
SocialSecurityTaxWithheld
SocialSecurityTips
SocialSecurityWages
SSN
State_Line1
StateIncomeTax_Line1
StateWagesTipsEtc_Line1
WagesTipsOtherCompensation
Melhorias na qualidade e suporte a novos campos. Não inclui divisor.
Melhorias na qualidade e suporte para campos da caixa 12 e previsões refinadas de EmployeeName, EmployeeAddress e EmployerNameAndAddress, que não fazem mais parte da saída e foram substituídos por outros campos.
Analisador de comprovação de documento de identidade
Descrição
Prever a validade de documentos de ID usando vários indicadores.
O processador de comprovação de documento de identificação foi projetado para ajudar a prever a validade de documentos de ID com quatro indicadores diferentes.
No momento, o processador retorna informações dos seguintes indicadores:
Detecção de fraud_signals_is_identity_document: prevê se uma imagem contém um documento de identificação reconhecido.
Detecção de fraud_signals_suspicious_words: prevê se há palavras que não são típicas em IDs.
Detecção de fraud_signals_image_manipulation: prevê se a imagem foi alterada ou adulterada com uma ferramenta de edição de imagens.
Detecção de fraud_signals_online_duplicate: prevê se a imagem pode ser encontrada on-line (somente nos EUA).
No momento, o recurso de detecção de duplicidade on-line é processado em data centers dos EUA. O suporte regional e multirregional não está disponível para esse recurso fora dos EUA.
Esse operador é compatível com algoritmos que são atualizados com mais frequência do que as novas versões do operador. Por isso, o processador pode retornar resultados diferentes ao longo do tempo, mesmo usando a mesma versão. Por exemplo, o sistema de detecção de duplicidade on-line monitora imagens presentes na Web. O comportamento do sistema pode mudar mais rápido do que pode ser rastreado nas versões do processador.
Consulte as observações sobre IA responsável[†] e revisão humana.[‡]
Idiomas disponíveis
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Inglês
en
Latn
Formulários/versões compatíveis
Suporte para passaportes, cartões-passaporte e carteiras de habilitação dos EUA.
Se o documento de entrada de várias páginas tiver mais de um comprovante de pagamento válido, o processador vai extrair entidades apenas do primeiro comprovante válido. Se nenhum contracheque for encontrado no arquivo de entrada, o processador vai retornar uma mensagem de erro.
Idiomas disponíveis
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Inglês
en
Latn
Versões do processador
ID da versão
Canal de lançamento
Nível de maturidade da versão
Outros campos detectados
Descrição
pretrained-paystub-v1.0-2021-03-19
Estável
GA
Nenhum
pretrained-paystub-v1.1-2021-08-13
Estável
GA
Mostrar campos
net_pay
net_pay_ytd
employee_account_number
Melhoria na qualidade e suporte a novos campos
pretrained-paystub-v1.2-2021-12-10
Estável
GA
Nenhum
pretrained-paystub-v2.0-2022-05-17
Versão candidata a lançamento
Prévia pública
Mostrar campos
deduction_item
deduction_item/deduction_type
deduction_item/deduction_this_period
deduction_item/deduction_ytd
direct_deposit_item
direct_deposit_item/direct_deposit
direct_deposit_item/employee_account_number
earning_item
earning_item/earning_type
earning_item/earning_rate
earning_item/earning_hours
earning_item/earning_this_period
earning_item/earning_ytd
page_number
tax_item
tax_item/tax_type
tax_item/tax_this_period
tax_item/tax_ytd
federal_additional_tax
federal_allowance
federal_marital_status
state_additional_tax
state_allowance
state_marital_status
Esta versão pressupõe que o arquivo de entrada contém um único contracheque. Ao contrário da versão padrão, essa versão não verifica o arquivo de entrada em busca de contracheques e não retorna um erro se nenhum for encontrado.
Melhoria na qualidade, suporte a novos campos e novo esquema. Bônus, comissões, férias, horas extras, salário normal e férias agora fazem parte de earning_item/earning_this_period, e as versões do ano até a data estão em earning_item/earning_ytd. O depósito direto e o número da conta do funcionário agora estão aninhados em direct_deposit_item.
O limite de páginas assíncronas é 10.
pretrained-paystub-v2.0-2022-07-22
Estável
GA
Nenhum
Melhorias na qualidade e no treinamento incremental.
Extrações de textos e valores de faturas, como número da fatura, nome do fornecedor, valor da fatura, valor fiscal, data da fatura e data de vencimento.
O analisador de faturas extrai campos de cabeçalho e itens de linha, como número da fatura, nome do fornecedor, valor da fatura, valor do tributo, data da fatura, data de vencimento e valores dos itens de linha.
O i18n só pode ser compatível com opções de treinamento personalizadas.
Idiomas disponíveis
Nome do idioma
Tag BCP 47
Script
Suporte para escrita à mão
Inglês
en
Latn
Versões do processador
ID da versão
Canal de lançamento
Nível de maturidade da versão
Descrição
pretrained-splitter-v1.5-2025-07-14
Versão candidata a lançamento
Prévia pública
Candidato a lançamento com tecnologia do LLM Gemini 2.5 Flash. Esse modelo pré-treinado pode ser usado sem treinamento prévio. Ele é compatível com divisão e classificação zero-shot.
[*] Este processador está disponível apenas para clientes com acesso limitado.
Para solicitar acesso à API, preencha e envie o formulário de solicitação de cliente de acesso limitado do Document AI.
Nesse formulário, são solicitadas informações sobre você, sua empresa e seu caso de uso.
É necessário ter um ID de projeto do Google Cloud para acessar.
Para criar um novo projeto do Google Cloud ou identificar o ID do seu projeto
atual, siga estas instruções.
Depois que você enviar o formulário, a equipe do Document AI
analisará sua solicitação para garantir que você atenda aos critérios de acesso.
Caso seja aprovado, você receberá um e-mail com instruções de como acessar
e usar esse recurso.
[†]
A comprovação de documento de identidade extrai e avalia informações de documentos ID que ajudam a identificar se a imagem de entrada representa um ID autêntico.
No Google Cloud, priorizamos ajudar os clientes a desenvolver e implementar soluções de IA com segurança, e a confirmação de identidade foi desenvolvida de acordo com os princípios de IA do Google.
Com base nos princípios de IA do Google e no design atual do produto, recomendamos cautela e avaliação cuidadosa dos possíveis benefícios e riscos de usar a confirmação de documento de identidade para:
Tomada de decisões sem um human in the loop para previsões que podem afetar os direitos humanos.
Em domínios sensíveis, incluindo, entre outros, emprego, acesso a serviços públicos, saúde e contextos críticos de segurança.
[‡] Sempre use a comprovação de identidade como parte do seu processo e fluxo de trabalho mais amplos de detecção de identidade.
É importante ter um revisor humano no seu fluxo de trabalho para verificar se os indicadores previstos são precisos. O processador de comprovação de identidade não foi criado para substituir a revisão humana de documentos de identificação em um fluxo de trabalho, mas sim para ajudar os revisores humanos a validar ID documentos. O processador de comprovação de identidade não deve ser usado como uma ferramenta de decisão automatizada para determinar se um ID é válido. Com a revisão humana, os clientes podem alcançar maior acurácia de processamento de documentos e ajudar as empresas a avaliar previsões usando ferramentas criadas especificamente para permitir essas revisões.
Analise a legislação na região em que você está implementando essa tecnologia e pesquise as orientações do setor para saber mais sobre as diretrizes da política e os problemas comuns de imparcialidade. Leia sobre imparcialidade no machine learning, incluindo maneiras de reduzir o viés em conjuntos de dados de treinamento, avaliar seus modelos personalizados para detectar disparidades no desempenho e outras considerações ao usar seu modelo personalizado.
Incentivamos os clientes a manter em mente as práticas recomendadas de imparcialidade, interpretabilidade, privacidade e segurança ao implementar a confirmação de identidade. Para saber mais sobre como implementar a IA responsável, leia as recomendações do Google para práticas de IA responsável.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-12-04 UTC."],[],[]]