Vous pouvez envoyer des formats, des dimensions et des tailles de fichiers spécifiques à Cloud Vision. Suivez ces conseils pour détecter efficacement les caractéristiques lorsque vous utilisez l'API Vision.
Formats des fichiers
L'API Cloud Vision est compatible avec les types d'images suivants :
- JPEG
- PNG8
- PNG24
- GIF
- Animation GIF (première image uniquement)
- BMP
- WEBP
- RAW
- ICO
- TIFF
Certains de ces formats d'image appliquent une compression avec perte (le format JPEG, par exemple). Réduire la définition de ce type d'images peut entraîner une dégradation de leur qualité et de la précision de l'API Vision.
Recommandations concernant les dimensions des images
Pour une détection d'image précise par l'API Vision, utilisez des images d'au moins 640 x 480 pixels (environ 300 000 pixels).
En pratique, une définition de 640 x 480 pixels convient dans la plupart des cas. Les définitions supérieures à 640 x 480 pixels n'offrent qu'un gain de précision modeste, et réduisent considérablement le débit. Dans la mesure du possible, prétraitez vos images afin de réduire leur définition à ce niveau.
Les définitions recommandées suivantes varient en fonction de la fonctionnalité détectée. Par exemple, les requêtes FACE_DETECTION nécessitent généralement des définitions supérieures, car les caractéristiques détectées (visages) n'occupent qu'une portion de l'image. Les requêtes LABEL_DETECTION, quant à elles, traitent généralement l'ensemble de l'image.
Le tableau suivant répertorie les types de requêtes de fonctionnalités de l'API Vision et les tailles d'image recommandées :
| Fonctionnalité de l'API Vision | Taille recommandée | Remarques |
|---|---|---|
FACE_DETECTION |
1 600 x 1 200 | La distance entre les yeux est le facteur le plus important. |
LANDMARK_DETECTION |
640 x 480 | - |
LOGO_DETECTION |
640 x 480 | - |
LABEL_DETECTION |
640 x 480 | - |
TEXT_DETECTION et DOCUMENT_TEXT_DETECTION |
1 024 x 768 | La reconnaissance optique des caractères nécessite des résolutions plus élevées afin de pouvoir détecter les caractères. |
SAFE_SEARCH_DETECTION |
640 x 480 | - |
L'API Vision requiert des images suffisamment grandes pour que les caractéristiques importantes puissent être distinguées. Des définitions inférieures ou supérieures à celles recommandées peuvent certes convenir. Cependant, une définition inférieure peut réduire la précision, tandis qu'une définition supérieure peut augmenter le temps de traitement et l'utilisation de la bande passante, sans offrir de gain tangible en termes de précision. Pour l'analyse par reconnaissance optique des caractères, la taille de l'image ne doit pas dépasser 75 000 000 pixels (longueur x largeur). Si une image dépasse cette limite, l'API Vision la redimensionne. Sinon, l'API Vision utilise l'image d'origine.
Taille des images et des fichiers
Les fichiers image envoyés à l'API Vision ne doivent pas dépasser 20 Mo. Les fichiers dépassant 20 Mo génèrent une erreur. L'API Vision ne redimensionne pas les fichiers de cette taille.
Pour améliorer la latence des requêtes, réduisez la taille de vos fichiers. Veillez toutefois à ne pas dégrader la qualité des images lors de cette opération.
L'API Vision limite la taille des requêtes JSON à 10 Mo. Hébergez les fichiers plus volumineux sur Cloud Storage ou sur le Web, plutôt que de les transmettre en tant que contenu encodé en base64 dans le fichier JSON lui-même.