Há formatos, dimensões e tamanhos de arquivo específicos que podem ser enviados para o Cloud Vision. Use estas orientações para garantir uma detecção de recursos eficaz ao usar a API Vision.
Formatos de arquivo
A API Vision é compatível com os seguintes tipos de imagem:
- JPEG
- PNG8
- PNG24
- GIF
- GIF animado (primeiro quadro apenas)
- BMP
- WEBP
- RAW
- ICO
- TIFF
Alguns desses formatos de imagem têm perdas (por exemplo, JPEG). A redução do tamanho do arquivo para esses formatos com perdas pode degradar a qualidade da imagem e a precisão da API Vision.
Recomendações de dimensões de imagem
Para uma detecção precisa de imagens na API Vision, use imagens com um mínimo de 640 x 480 pixels (cerca de 300.000 pixels).
Na prática, o tamanho padrão de 640 x 480 pixels funciona bem na maioria dos casos. Imagens maiores que 640 x 480 pixels podem não ganhar muito em acurácia e ainda diminuir consideravelmente a capacidade de processamento. Sempre que possível, processe previamente as imagens para reduzir o tamanho delas a esses padrões mínimos.
Os seguintes tamanhos recomendados variam de acordo com o recurso detectado. Por exemplo, solicitações FACE_DETECTION geralmente exigem tamanhos de imagem maiores porque os recursos detectados (rostos) são menores do que a imagem. As solicitações LABEL_DETECTION, por outro lado, geralmente avaliam uma imagem inteira.
A tabela a seguir lista os tipos de solicitações de recursos da API Vision e os tamanhos de imagem recomendados:
| Recurso da API Vision | Tamanho recomendado | Observações |
|---|---|---|
FACE_DETECTION |
1600x1200 | A distância entre os olhos é o mais importante. |
LANDMARK_DETECTION |
640 x 480 | - |
LOGO_DETECTION |
640 x 480 | - |
LABEL_DETECTION |
640 x 480 | - |
TEXT_DETECTION e DOCUMENT_TEXT_DETECTION |
1024x768 | O OCR requer mais resolução para detectar os caracteres. |
SAFE_SEARCH_DETECTION |
640 x 480 | - |
A API Vision exige imagens grandes o suficiente para distinguir recursos importantes. Tamanhos menores ou maiores do que os recomendados podem funcionar. mas os menores podem diminuir a precisão e os maiores podem aumentar o tempo de processamento e o uso da largura de banda sem um ganho proporcional de precisão. Para análise de OCR, o tamanho da imagem não pode exceder 75.000.000 pixels (comprimento x largura). Se uma imagem exceder esse limite, a API Vision vai redimensioná-la. Caso contrário, a API Vision vai usar a imagem original.
Tamanho da imagem e do arquivo
Os arquivos de imagem enviados para a API Vision não podem exceder 20 MB. Os arquivos maiores que 20 MB geram um erro. A API Vision não redimensiona arquivos desse tamanho.
Para melhorar a latência da consulta, reduza o tamanho do arquivo. No entanto, evite reduzir a qualidade da imagem durante esse processo.
A API Vision impõe um limite de tamanho de solicitação JSON de 10 MB. Hospede arquivos maiores no Cloud Storage ou na Web, em vez de transmiti-los como conteúdo codificado em base64 no próprio JSON.