Formats et dimensions d'image acceptés

Vous pouvez envoyer des formats, des dimensions et des tailles de fichiers spécifiques à Cloud Vision. Suivez ces conseils pour détecter efficacement les caractéristiques lorsque vous utilisez l'API Vision.

Formats des fichiers

L'API Cloud Vision est compatible avec les types d'images suivants :

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • Animation GIF (première image uniquement)
  • BMP
  • WEBP
  • RAW
  • ICO
  • PDF
  • TIFF

Certains de ces formats d'image appliquent une compression avec perte (le format JPEG, par exemple). Réduire la définition de ce type d'images peut entraîner une dégradation de leur qualité et de la précision de l'API Vision.

Recommandations concernant les dimensions des images

Pour une détection d'image précise par l'API Vision, utilisez des images d'au moins 640 x 480 pixels (environ 300 000 pixels).

En pratique, une définition de 640 x 480 pixels convient dans la plupart des cas. Les définitions supérieures à 640 x 480 pixels n'offrent qu'un gain de précision modeste, et réduisent considérablement le débit. Dans la mesure du possible, prétraitez vos images afin de réduire leur définition à ce niveau.

Les définitions recommandées suivantes varient en fonction de la fonctionnalité détectée. Par exemple, les requêtes FACE_DETECTION nécessitent généralement des définitions supérieures, car les caractéristiques détectées (visages) n'occupent qu'une portion de l'image. Les requêtes LABEL_DETECTION, quant à elles, traitent généralement l'ensemble de l'image.

Le tableau suivant répertorie les types de requêtes de fonctionnalités de l'API Vision et les tailles d'image recommandées :

Fonctionnalité de l'API Vision Taille recommandée Remarques
FACE_DETECTION 1 600 x 1 200 La distance entre les yeux est le facteur le plus important.
LANDMARK_DETECTION 640 x 480 -
LOGO_DETECTION 640 x 480 -
LABEL_DETECTION 640 x 480 -
TEXT_DETECTION et DOCUMENT_TEXT_DETECTION 1 024 x 768 La reconnaissance optique des caractères nécessite des résolutions plus élevées afin de pouvoir détecter les caractères.
SAFE_SEARCH_DETECTION 640 x 480 -

L'API Vision requiert des images suffisamment grandes pour que les caractéristiques importantes puissent être distinguées. Des définitions inférieures ou supérieures à celles recommandées peuvent certes convenir. Cependant, une définition inférieure peut réduire la précision, tandis qu'une définition supérieure peut augmenter le temps de traitement et l'utilisation de la bande passante, sans offrir de gain tangible en termes de précision. Pour l'analyse par reconnaissance optique des caractères, la taille de l'image ne doit pas dépasser 75 000 000 pixels (longueur x largeur). Si une image dépasse cette limite, l'API Vision la redimensionne. Sinon, l'API Vision utilise l'image d'origine.

Taille des images et des fichiers

Les fichiers image envoyés à l'API Vision ne doivent pas dépasser 20 Mo. Les fichiers dépassant 20 Mo génèrent une erreur. L'API Vision ne redimensionne pas les fichiers de cette taille.

Pour améliorer la latence des requêtes, réduisez la taille de vos fichiers. Veillez toutefois à ne pas dégrader la qualité des images lors de cette opération.

L'API Vision limite la taille des requêtes JSON à 10 Mo. Hébergez les fichiers plus volumineux sur Cloud Storage ou sur le Web, plutôt que de les transmettre en tant que contenu encodé en base64 dans le fichier JSON lui-même.