Formatos e dimensões de imagem compatíveis

Há formatos, dimensões e tamanhos de arquivo específicos que podem ser enviados para o Cloud Vision. Use estas orientações para garantir uma detecção de recursos eficaz ao usar a API Vision.

Formatos de arquivo

A API Vision é compatível com os seguintes tipos de imagem:

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • GIF animado (primeiro quadro apenas)
  • BMP
  • WEBP
  • RAW
  • ICO
  • PDF
  • TIFF

Alguns desses formatos de imagem têm perdas (por exemplo, JPEG). A redução do tamanho do arquivo para esses formatos com perdas pode degradar a qualidade da imagem e a precisão da API Vision.

Recomendações de dimensões de imagem

Para uma detecção precisa de imagens na API Vision, use imagens com um mínimo de 640 x 480 pixels (cerca de 300.000 pixels).

Na prática, o tamanho padrão de 640 x 480 pixels funciona bem na maioria dos casos. Imagens maiores que 640 x 480 pixels podem não ganhar muito em acurácia e ainda diminuir consideravelmente a capacidade de processamento. Sempre que possível, processe previamente as imagens para reduzir o tamanho delas a esses padrões mínimos.

Os seguintes tamanhos recomendados variam de acordo com o recurso detectado. Por exemplo, solicitações FACE_DETECTION geralmente exigem tamanhos de imagem maiores porque os recursos detectados (rostos) são menores do que a imagem. As solicitações LABEL_DETECTION, por outro lado, geralmente avaliam uma imagem inteira.

A tabela a seguir lista os tipos de solicitações de recursos da API Vision e os tamanhos de imagem recomendados:

Recurso da API Vision Tamanho recomendado Observações
FACE_DETECTION 1600x1200 A distância entre os olhos é o mais importante.
LANDMARK_DETECTION 640 x 480 -
LOGO_DETECTION 640 x 480 -
LABEL_DETECTION 640 x 480 -
TEXT_DETECTION e DOCUMENT_TEXT_DETECTION 1024x768 O OCR requer mais resolução para detectar os caracteres.
SAFE_SEARCH_DETECTION 640 x 480 -

A API Vision exige imagens grandes o suficiente para distinguir recursos importantes. Tamanhos menores ou maiores do que os recomendados podem funcionar. mas os menores podem diminuir a precisão e os maiores podem aumentar o tempo de processamento e o uso da largura de banda sem um ganho proporcional de precisão. Para análise de OCR, o tamanho da imagem não pode exceder 75.000.000 pixels (comprimento x largura). Se uma imagem exceder esse limite, a API Vision vai redimensioná-la. Caso contrário, a API Vision vai usar a imagem original.

Tamanho da imagem e do arquivo

Os arquivos de imagem enviados para a API Vision não podem exceder 20 MB. Os arquivos maiores que 20 MB geram um erro. A API Vision não redimensiona arquivos desse tamanho.

Para melhorar a latência da consulta, reduza o tamanho do arquivo. No entanto, evite reduzir a qualidade da imagem durante esse processo.

A API Vision impõe um limite de tamanho de solicitação JSON de 10 MB. Hospede arquivos maiores no Cloud Storage ou na Web, em vez de transmiti-los como conteúdo codificado em base64 no próprio JSON.