您可以傳送特定圖片格式、圖片尺寸和檔案大小的圖片至 Cloud Vision。請參閱這份指南,確保使用 Vision API 時能有效偵測特徵。
檔案格式
Vision API 支援下列圖片類型:
- JPEG
- PNG8
- PNG24
- GIF
- GIF 動畫 (僅限第一個影格)
- BMP
- WEBP
- RAW
- ICO
- TIFF
其中部分圖片格式為有損 (例如 JPEG)。縮減這類有損格式的檔案大小可能會降低圖片品質和 Vision API 的準確度。
圖片尺寸建議
如要在 Vision API 中準確偵測圖片,請使用至少 640x480 像素 (約 300,000 像素) 的圖片。
實務上,640x480 像素的標準大小在大多數情況下都適用。如果圖片大小超過 640x480 像素,準確度可能不會大幅提升,但輸送量會大幅降低。請盡可能預先處理圖片,將圖片大小縮減至這些最低標準。
建議大小會因偵測到的特徵而異。舉例來說,FACE_DETECTION 要求通常需要較大的圖片大小,因為偵測到的特徵 (臉部) 比圖片小。LABEL_DETECTION要求則通常會評估整張圖片。
下表列出 Vision API 功能要求的類型,以及建議的圖片大小:
| Vision API 功能 | 建議大小 | 附註 |
|---|---|---|
FACE_DETECTION |
1600x1200 | 雙眼之間的距離最為重要。 |
LANDMARK_DETECTION |
640x480 | - |
LOGO_DETECTION |
640x480 | - |
LABEL_DETECTION |
640x480 | - |
TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION |
1024x768 | 光學字元辨識需要更高解析度才能偵測字元。 |
SAFE_SEARCH_DETECTION |
640x480 | - |
Vision API 需要夠大的圖片,才能辨識重要特徵。 小於或大於建議大小的圖片也可以使用,不過,較小的尺寸可能會導致準確度降低,而較大的尺寸可能會增加處理時間和頻寬用量,但準確度不會成比例提升。如要進行 OCR 分析,圖片大小不得超過 75,000,000 像素 (長度 x 寬度)。如果圖片超過此限制,Vision API 會調整大小;否則,Vision API 會使用原始圖片。
圖片和檔案大小
傳送至 Vision API 的圖片檔不得超過 20 MB。如果檔案超過 20 MB,系統會產生錯誤。Vision API 不會調整此大小的檔案。
如要縮短查詢延遲時間,請縮減檔案大小。但請避免在這項程序中降低圖片品質。
Vision API 的 JSON 要求大小上限為 10 MB。請將較大的檔案託管在 Cloud Storage 或網路上,而不是在 JSON 中以 base64 編碼內容的形式傳遞。