Índice
ImageAnnotator(interface)AnnotateFileRequest(mensagem)AnnotateFileResponse(mensagem)AnnotateImageRequest(mensagem)AnnotateImageResponse(mensagem)BatchAnnotateFilesRequest(mensagem)BatchAnnotateFilesResponse(mensagem)BatchAnnotateImagesRequest(mensagem)BatchAnnotateImagesResponse(mensagem)Block(mensagem)Block.BlockType(enum)BoundingPoly(mensagem)EntityAnnotation(mensagem)Feature(mensagem)Feature.Type(enum)Image(mensagem)ImageAnnotationContext(mensagem)ImageContext(mensagem)InputConfig(mensagem)NormalizedVertex(mensagem)Page(mensagem)Paragraph(mensagem)Property(mensagem)Symbol(mensagem)TextAnnotation(mensagem)TextAnnotation.DetectedBreak(mensagem)TextAnnotation.DetectedBreak.BreakType(enum)TextAnnotation.DetectedLanguage(mensagem)TextAnnotation.TextProperty(mensagem)TextDetectionParams(mensagem)Vertex(mensagem)Word(mensagem)
ImageAnnotator
Serviço que executa tarefas de deteção da Google Cloud Vision API em imagens do cliente, como deteção de caras, pontos de referência, logótipos, etiquetas e texto. O serviço ImageAnnotator devolve entidades detetadas das imagens.
| BatchAnnotateFiles |
|---|
|
Serviço que realiza a deteção e a anotação de imagens para um lote de ficheiros. Agora, apenas são suportados os tipos "application/pdf", "image/tiff" e "image/gif". Este serviço extrai, no máximo, 5 frames (GIF) ou páginas (PDF ou TIFF) de cada ficheiro fornecido e realiza a deteção e a anotação de cada imagem extraída. Os clientes podem especificar que 5 frames ou páginas querem no AnnotateFileRequest.pages.
|
| BatchAnnotateImages |
|---|
|
Executar a deteção e a anotação de imagens para um lote de imagens.
|
AnnotateFileRequest
Um pedido para anotar um único ficheiro, por exemplo, um ficheiro PDF, TIFF ou GIF.
| Campos | |
|---|---|
input_config |
Obrigatório. Informações sobre o ficheiro de entrada. |
features[] |
Obrigatório. Funcionalidades pedidas. |
image_context |
Contexto adicional que pode acompanhar as imagens no ficheiro. |
pages[] |
Páginas do ficheiro para fazer a anotação de imagens. As páginas começam a partir de 1. Presumimos que a primeira página do ficheiro é a página 1. São suportadas, no máximo, 5 páginas por pedido. As páginas podem ser negativas. Página 1 significa a primeira página. Página 2 significa a segunda página. A página -1 significa a última página. A página -2 significa a penúltima página. Se o ficheiro for GIF em vez de PDF ou TIFF, a página refere-se a frames GIF. Se este campo estiver vazio, por predefinição, o serviço realiza a anotação de imagens para as primeiras 5 páginas do ficheiro. |
AnnotateFileResponse
Resposta a um pedido de anotação de um único ficheiro. Um ficheiro pode conter uma ou mais imagens, que têm individualmente as suas próprias respostas.
| Campos | |
|---|---|
input_config |
Informações sobre o ficheiro para o qual esta resposta é gerada. |
responses[] |
Respostas individuais a imagens encontradas no ficheiro. Este campo fica vazio se o campo |
total_pages |
Este campo indica o número total de páginas no ficheiro. |
error |
Se definido, representa a mensagem de erro do pedido com falha. Neste caso, o campo |
AnnotateImageRequest
Pedido para realizar tarefas da Google Cloud Vision API numa imagem fornecida pelo utilizador, com funcionalidades pedidas pelo utilizador e com informações de contexto.
| Campos | |
|---|---|
image |
A imagem a ser processada. |
features[] |
Funcionalidades pedidas. |
image_context |
Contexto adicional que pode acompanhar a imagem. |
AnnotateImageResponse
Resposta a um pedido de anotação de imagem.
| Campos | |
|---|---|
text_annotations[] |
Se estiver presente, a deteção de texto (OCR) foi concluída com êxito. |
full_text_annotation |
Se estiver presente, a deteção de texto (OCR) ou a deteção de texto de documentos (OCR) foi concluída com êxito. Esta anotação fornece a hierarquia estrutural do texto detetado pelo OCR. |
error |
Se definido, representa a mensagem de erro da operação. Tenha em atenção que as anotações de imagens preenchidas têm a garantia de estar corretas, mesmo quando |
context |
Se estiverem presentes, são necessárias informações contextuais para compreender a origem desta imagem. |
BatchAnnotateFilesRequest
Uma lista de pedidos para anotar ficheiros através da API BatchAnnotateFiles.
| Campos | |
|---|---|
requests[] |
Obrigatório. A lista de pedidos de anotação de ficheiros. Atualmente, só suportamos um AnnotateFileRequest em BatchAnnotateFilesRequest. |
parent |
Opcional. Projeto e localização de destino para fazer uma chamada. Formato: Se não for especificado nenhum elemento principal, é escolhida uma região automaticamente. IDs de localização suportados: Exemplo: |
BatchAnnotateFilesResponse
Uma lista de respostas de anotações de ficheiros.
| Campos | |
|---|---|
responses[] |
A lista de respostas de anotação de ficheiros, cada resposta correspondente a cada AnnotateFileRequest em BatchAnnotateFilesRequest. |
BatchAnnotateImagesRequest
Vários pedidos de anotação de imagens são processados em lote numa única chamada de serviço.
| Campos | |
|---|---|
requests[] |
Obrigatório. Pedidos de anotação de imagens individuais para este lote. |
parent |
Opcional. Projeto e localização de destino para fazer uma chamada. Formato: Se não for especificado nenhum elemento principal, é escolhida uma região automaticamente. IDs de localização suportados: Exemplo: |
BatchAnnotateImagesResponse
Resposta a um pedido de anotação de imagens em lote.
| Campos | |
|---|---|
responses[] |
Respostas individuais a pedidos de anotação de imagens no lote. |
Bloquear
Elemento lógico na página.
| Campos | |
|---|---|
property |
Foram detetadas informações adicionais para o bloqueio. |
bounding_box |
A caixa limitadora do bloco. Os vértices estão na ordem superior esquerdo, superior direito, inferior direito e inferior esquerdo. Quando é detetada uma rotação da caixa delimitadora, a rotação é representada em torno do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo:
e a ordem dos vértices continua a ser (0, 1, 2, 3). |
paragraphs[] |
Lista de parágrafos neste bloco (se este bloco for do tipo texto). |
block_type |
Tipo de bloco detetado (texto, imagem, etc.) para este bloco. |
confidence |
Confiança dos resultados de OCR no bloco. Intervalo [0, 1]. |
BlockType
Tipo de um bloco (texto, imagem, etc.) conforme identificado pelo OCR.
| Enumerações | |
|---|---|
UNKNOWN |
Tipo de bloco desconhecido. |
TEXT |
Bloco de texto normal. |
TABLE |
Bloco de tabela. |
PICTURE |
Bloqueio de imagem. |
RULER |
Caixa de linhas horizontais/verticais. |
BARCODE |
Bloco de código de barras. |
BoundingPoly
Um polígono de limite para a anotação de imagem detetada.
| Campos | |
|---|---|
vertices[] |
Os vértices do polígono delimitador. |
normalized_vertices[] |
Os vértices normalizados do polígono delimitador. |
EntityAnnotation
Conjunto de funcionalidades de entidades detetadas.
| Campos | |
|---|---|
mid |
ID de entidade opaco. Alguns IDs podem estar disponíveis na API Google Knowledge Graph Search. |
locale |
O código de idioma da região em que o texto da entidade |
description |
Descrição textual da entidade, expressa no respetivo idioma |
score |
Pontuação geral do resultado. Intervalo [0, 1]. |
confidence |
Descontinuado. Em alternativa, use |
topicality |
A relevância da etiqueta ICA (anotação de conteúdo de imagem) para a imagem. Por exemplo, a relevância de "torre" é provavelmente superior para uma imagem que contenha a "Torre Eiffel" detetada do que para uma imagem que contenha um edifício alto distante detetado, mesmo que a confiança de que existe uma torre em cada imagem possa ser a mesma. Intervalo [0, 1]. |
bounding_poly |
Região da imagem à qual esta entidade pertence. Não produzido para funcionalidades |
properties[] |
Algumas entidades podem ter campos |
Funcionalidade
O tipo de deteção da API Google Cloud Vision a realizar e o número máximo de resultados a devolver para esse tipo. Podem ser especificados vários objetos Feature na lista features.
| Campos | |
|---|---|
type |
O tipo de funcionalidade. |
model |
Modelo a usar para a funcionalidade. Valores suportados: "builtin/stable" (a predefinição se não estiver definida) e "builtin/latest". |
Tipo
Tipo de funcionalidade da API Google Cloud Vision a ser extraída.
| Enumerações | |
|---|---|
TYPE_UNSPECIFIED |
Tipo de funcionalidade não especificado. |
TEXT_DETECTION |
Executar deteção de texto / reconhecimento ótico de carateres (OCR). A deteção de texto está otimizada para áreas de texto numa imagem maior. Se a imagem for um documento, use DOCUMENT_TEXT_DETECTION. |
DOCUMENT_TEXT_DETECTION |
Executar OCR de documentos de texto denso. Tem precedência quando DOCUMENT_TEXT_DETECTION e TEXT_DETECTION estão presentes. |
Imagem
Imagem do cliente para realizar tarefas da Google Cloud Vision API.
| Campos | |
|---|---|
content |
Conteúdo de imagem, representado como um fluxo de bytes. Nota: tal como acontece com todos os campos Atualmente, este campo só funciona para pedidos BatchAnnotateImages. Não funciona para pedidos AsyncBatchAnnotateImages. |
ImageAnnotationContext
Se uma imagem foi produzida a partir de um ficheiro (por exemplo, um PDF), esta mensagem fornece informações sobre a origem dessa imagem.
| Campos | |
|---|---|
uri |
O URI do ficheiro usado para produzir a imagem. |
page_number |
Se o ficheiro era um PDF ou um TIFF, este campo indica o número da página no ficheiro usado para produzir a imagem. |
ImageContext
Contexto da imagem e/ou parâmetros específicos da funcionalidade.
| Campos | |
|---|---|
language_hints[] |
Lista de idiomas a usar para TEXT_DETECTION. Na maioria dos casos, um valor vazio produz os melhores resultados, uma vez que permite a deteção automática do idioma. Para idiomas baseados no alfabeto latino, não é necessário definir |
text_detection_params |
Parâmetros para a deteção de texto e a deteção de texto em documentos. |
InputConfig
A localização de entrada e os metadados pretendidos.
| Campos | |
|---|---|
content |
Conteúdo do ficheiro, representado como uma stream de bytes. Nota: tal como acontece com todos os campos Atualmente, este campo só funciona para pedidos BatchAnnotateFiles. Não funciona para pedidos AsyncBatchAnnotateFiles. |
mime_type |
O tipo de ficheiro. Atualmente, apenas são suportados os tipos "application/pdf", "image/tiff" e "image/gif". Os carateres universais não são compatíveis. |
NormalizedVertex
Um vértice representa um ponto 2D na imagem. NOTA: as coordenadas dos vértices normalizadas são relativas à imagem original e variam entre 0 e 1.
| Campos | |
|---|---|
x |
Coordenada X. |
y |
Coordenada Y. |
Página
Página detetada a partir do OCR.
| Campos | |
|---|---|
property |
Foram detetadas informações adicionais na página. |
width |
Largura da página. Para PDFs, a unidade é pontos. Para imagens (incluindo TIFFs), a unidade é píxeis. |
height |
Altura da página. Para PDFs, a unidade é pontos. Para imagens (incluindo TIFFs), a unidade é píxeis. |
blocks[] |
Lista de blocos de texto, imagens, etc. nesta página. |
confidence |
Confiança nos resultados de OCR na página. Intervalo [0, 1]. |
Parágrafo
Unidade estrutural de texto que representa um número de palavras numa determinada ordem.
| Campos | |
|---|---|
property |
Foram detetadas informações adicionais para o parágrafo. |
bounding_box |
A caixa limitadora do parágrafo. Os vértices estão na ordem superior esquerdo, superior direito, inferior direito e inferior esquerdo. Quando é detetada uma rotação da caixa delimitadora, a rotação é representada em torno do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo: * Quando o texto está na horizontal, pode ter o seguinte aspeto: 0----1 | | 3----2 * Quando é rodado 180 graus em torno do canto superior esquerdo, torna-se: 2----3 | | 1----0 e a ordem dos vértices continua a ser (0, 1, 2, 3). |
words[] |
Lista de todas as palavras neste parágrafo. |
confidence |
Confiança dos resultados de OCR para o parágrafo. Intervalo [0, 1]. |
Propriedade
Um Property consiste num par de nome/valor fornecido pelo utilizador.
| Campos | |
|---|---|
name |
Nome da propriedade. |
value |
Valor da propriedade. |
uint64_value |
Valor das propriedades numéricas. |
Símbolo
Uma representação de símbolo único.
| Campos | |
|---|---|
property |
Foram detetadas informações adicionais para o símbolo. |
bounding_box |
A caixa delimitadora do símbolo. Os vértices estão na ordem superior esquerdo, superior direito, inferior direito e inferior esquerdo. Quando é detetada uma rotação da caixa delimitadora, a rotação é representada em torno do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo: * Quando o texto está na horizontal, pode ter o seguinte aspeto: 0----1 | | 3----2 * Quando é rodado 180 graus em torno do canto superior esquerdo, torna-se: 2----3 | | 1----0 e a ordem dos vértices continua a ser (0, 1, 2, 3). |
text |
A representação UTF-8 real do símbolo. |
confidence |
Confiança dos resultados de OCR para o símbolo. Intervalo [0, 1]. |
TextAnnotation
TextAnnotation contém uma representação estruturada do texto extraído por OCR. A hierarquia de uma estrutura de texto extraída por OCR é a seguinte:
TextAnnotation -> Página -> Bloco -> Parágrafo -> Palavra -> Símbolo
TextAnnotation.TextProperty que se segue.
| Campos | |
|---|---|
pages[] |
Lista de páginas detetadas pelo OCR. |
text |
Texto UTF-8 detetado nas páginas. |
DetectedBreak
Início ou fim de um componente estrutural detetado.
| Campos | |
|---|---|
type |
Tipo de quebra detetado. |
is_prefix |
Verdadeiro se a quebra preceder o elemento. |
BreakType
Enum para denotar o tipo de interrupção encontrado. Nova linha, espaço, etc.
| Enumerações | |
|---|---|
UNKNOWN |
Tipo de etiqueta de quebra desconhecido. |
SPACE |
Espaço normal. |
SURE_SPACE |
Espaço certo (muito largo). |
EOL_SURE_SPACE |
Quebra de moldagem de linhas. |
HYPHEN |
Hífen no final da linha que não está presente no texto; não ocorre em simultâneo com SPACE, LEADER_SPACE ou LINE_BREAK. |
LINE_BREAK |
Quebra de linha que termina um parágrafo. |
DetectedLanguage
Idioma detetado para um componente estrutural.
| Campos | |
|---|---|
language_code |
O código de idioma BCP-47, como "en-US" ou "sr-Latn". Para mais informações, consulte https://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
Confiança do idioma detetado. Intervalo [0, 1]. |
TextProperty
Foram detetadas informações adicionais no componente estrutural.
| Campos | |
|---|---|
detected_languages[] |
Uma lista de idiomas detetados juntamente com a confiança. |
detected_break |
Início ou fim detetado de um segmento de texto. |
TextDetectionParams
Parâmetros para deteções de texto. Isto é usado para controlar as funcionalidades TEXT_DETECTION e DOCUMENT_TEXT_DETECTION.
| Campos | |
|---|---|
enable_text_detection_confidence_score |
Por predefinição, a Cloud Vision API inclui apenas a pontuação de confiança para o resultado DOCUMENT_TEXT_DETECTION. Defina a flag como true para incluir também a pontuação de confiança para TEXT_DETECTION. |
advanced_ocr_options[] |
Uma lista de opções avançadas de OCR para ajustar o comportamento do OCR. |
Vertex
Um vértice representa um ponto 2D na imagem. NOTA: as coordenadas dos vértices estão na mesma escala que a imagem original.
| Campos | |
|---|---|
x |
Coordenada X. |
y |
Coordenada Y. |
Word
Uma representação de palavras.
| Campos | |
|---|---|
property |
Foram detetadas informações adicionais para a palavra. |
bounding_box |
A caixa limitadora da palavra. Os vértices estão na ordem superior esquerdo, superior direito, inferior direito e inferior esquerdo. Quando é detetada uma rotação da caixa delimitadora, a rotação é representada em torno do canto superior esquerdo, conforme definido quando o texto é lido na orientação "natural". Por exemplo: * Quando o texto está na horizontal, pode ter o seguinte aspeto: 0----1 | | 3----2 * Quando é rodado 180 graus em torno do canto superior esquerdo, torna-se: 2----3 | | 1----0 e a ordem dos vértices continua a ser (0, 1, 2, 3). |
symbols[] |
Lista de símbolos na palavra. A ordem dos símbolos segue a ordem de leitura natural. |
confidence |
Confiança dos resultados de OCR para a palavra. Intervalo [0, 1]. |