Esistono formati, dimensioni e dimensioni dei file specifici che puoi inviare a Cloud Vision. Utilizza queste linee guida per garantire un rilevamento efficace delle funzionalità quando utilizzi l'API Vision.
Formati file
L'API Vision supporta i seguenti tipi di immagini:
- JPEG
- PNG8
- PNG24
- GIF
- GIF animata (solo il primo fotogramma)
- BMP
- WEBP
- RAW
- ICO
- TIFF
Alcuni di questi formati immagine sono con perdita (ad esempio, JPEG). La riduzione delle dimensioni dei file per questi formati con perdita potrebbe peggiorare la qualità delle immagini e l'accuratezza dell'API Vision.
Consigli sulle dimensioni delle immagini
Per un rilevamento accurato delle immagini all'interno dell'API Vision, utilizza immagini di almeno 640 x 480 pixel (circa 300.000 pixel).
In pratica, una dimensione standard di 640 x 480 pixel funziona bene nella maggior parte dei casi. Le dimensioni dell'immagine superiori a 640 x 480 pixel potrebbero non aumentare molto l'accuratezza, riducendo notevolmente la velocità effettiva. Se possibile, pre-elabora le immagini per ridurne le dimensioni in base a questi standard minimi.
Le seguenti dimensioni consigliate variano in base alla funzionalità rilevata. Ad esempio,
le richieste FACE_DETECTION in genere richiedono dimensioni delle immagini maggiori perché
le funzionalità rilevate (volti) sono più piccole dell'immagine. Le richieste LABEL_DETECTION, invece, valutano generalmente un'intera immagine.
La tabella seguente elenca i tipi di richieste di funzionalità dell'API Vision e le dimensioni delle immagini consigliate:
| Funzionalità dell'API Vision | Dimensioni consigliate | Note |
|---|---|---|
FACE_DETECTION |
1600x1200 | La distanza tra gli occhi è la più importante. |
LANDMARK_DETECTION |
640x480 | - |
LOGO_DETECTION |
640x480 | - |
LABEL_DETECTION |
640x480 | - |
TEXT_DETECTION e DOCUMENT_TEXT_DETECTION |
1024x768 | L'OCR richiede una risoluzione maggiore per rilevare i caratteri. |
SAFE_SEARCH_DETECTION |
640x480 | - |
L'API Vision richiede immagini sufficientemente grandi da distinguere le caratteristiche importanti. Possono essere utilizzate dimensioni inferiori o superiori a quelle consigliate. Tuttavia, dimensioni più piccole possono comportare una minore precisione, mentre dimensioni più grandi possono aumentare il tempo di elaborazione e l'utilizzo della larghezza di banda senza un aumento proporzionale della precisione. Per l'analisi OCR, le dimensioni dell'immagine non devono superare i 75.000.000 di pixel (lunghezza x larghezza). Se un'immagine supera questo limite, l'API Vision la ridimensiona; in caso contrario, l'API Vision utilizza l'immagine originale.
Dimensioni di immagini e file
I file immagine inviati all'API Vision non devono superare i 20 MB. I file superiori a 20 MB generano un errore. L'API Vision non ridimensiona i file di queste dimensioni.
Per migliorare la latenza delle query, riduci le dimensioni del file. Tuttavia, evita di ridurre la qualità dell'immagine durante questa procedura.
L'API Vision impone un limite di dimensioni della richiesta JSON di 10 MB. Ospita file più grandi su Cloud Storage o sul web, anziché passarli come contenuti con codifica base64 nel JSON stesso.