Google utilise la technologie IA pour traduire le contenu dans votre langue préférée. Les traductions générées par IA peuvent contenir des erreurs.

Formats et dimensions d'image acceptés

Vous pouvez envoyer des formats, des dimensions et des tailles de fichiers spécifiques à Cloud Vision. Suivez ces conseils pour détecter efficacement les caractéristiques lorsque vous utilisez l'API Vision.

Formats des fichiers

L'API Cloud Vision est compatible avec les types d'images suivants :

JPEG
PNG8
PNG24
GIF
Animation GIF (première image uniquement)
BMP
WEBP
RAW
ICO
PDF
TIFF

Certains de ces formats d'image appliquent une compression avec perte (le format JPEG, par exemple). Réduire la définition de ce type d'images peut entraîner une dégradation de leur qualité et de la précision de l'API Vision.

Recommandations concernant les dimensions des images

Pour une détection d'image précise par l'API Vision, utilisez des images d'au moins 640 x 480 pixels (environ 300 000 pixels).

En pratique, une définition de 640 x 480 pixels convient dans la plupart des cas. Les définitions supérieures à 640 x 480 pixels n'offrent qu'un gain de précision modeste, et réduisent considérablement le débit. Dans la mesure du possible, prétraitez vos images afin de réduire leur définition à ce niveau.

Les définitions recommandées suivantes varient en fonction de la fonctionnalité détectée. Par exemple, les requêtes FACE_DETECTION nécessitent généralement des définitions supérieures, car les caractéristiques détectées (visages) n'occupent qu'une portion de l'image. Les requêtes LABEL_DETECTION, quant à elles, traitent généralement l'ensemble de l'image.

Le tableau suivant répertorie les types de requêtes de fonctionnalités de l'API Vision et les tailles d'image recommandées :

Fonctionnalité de l'API Vision	Taille recommandée	Remarques
`FACE_DETECTION`	1 600 x 1 200	La distance entre les yeux est le facteur le plus important.
`LANDMARK_DETECTION`	640 x 480	-
`LOGO_DETECTION`	640 x 480	-
`LABEL_DETECTION`	640 x 480	-
`TEXT_DETECTION` et `DOCUMENT_TEXT_DETECTION`	1 024 x 768	La reconnaissance optique des caractères nécessite des résolutions plus élevées afin de pouvoir détecter les caractères.
`SAFE_SEARCH_DETECTION`	640 x 480	-

L'API Vision requiert des images suffisamment grandes pour que les caractéristiques importantes puissent être distinguées. Des définitions inférieures ou supérieures à celles recommandées peuvent certes convenir. Cependant, une définition inférieure peut réduire la précision, tandis qu'une définition supérieure peut augmenter le temps de traitement et l'utilisation de la bande passante, sans offrir de gain tangible en termes de précision. Pour l'analyse par reconnaissance optique des caractères, la taille de l'image ne doit pas dépasser 75 000 000 pixels (longueur x largeur). Si une image dépasse cette limite, l'API Vision la redimensionne. Sinon, l'API Vision utilise l'image d'origine.

Taille des images et des fichiers

Les fichiers image envoyés à l'API Vision ne doivent pas dépasser 20 Mo. Les fichiers dépassant 20 Mo génèrent une erreur. L'API Vision ne redimensionne pas les fichiers de cette taille.

Pour améliorer la latence des requêtes, réduisez la taille de vos fichiers. Veillez toutefois à ne pas dégrader la qualité des images lors de cette opération.

L'API Vision limite la taille des requêtes JSON à 10 Mo. Hébergez les fichiers plus volumineux sur Cloud Storage ou sur le Web, plutôt que de les transmettre en tant que contenu encodé en base64 dans le fichier JSON lui-même.

Formats et dimensions d'image acceptés Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Formats des fichiers

Recommandations concernant les dimensions des images

Taille des images et des fichiers

Formats et dimensions d'image acceptés