Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

支援的圖片格式和尺寸

您可以傳送特定圖片格式、圖片尺寸和檔案大小的圖片至 Cloud Vision。請參閱這份指南，確保使用 Vision API 時能有效偵測特徵。

檔案格式

Vision API 支援下列圖片類型：

JPEG
PNG8
PNG24
GIF
GIF 動畫 (僅限第一個影格)
BMP
WEBP
RAW
ICO
PDF
TIFF

其中部分圖片格式為有損 (例如 JPEG)。縮減這類有損格式的檔案大小可能會降低圖片品質和 Vision API 的準確度。

圖片尺寸建議

如要在 Vision API 中準確偵測圖片，請使用至少 640x480 像素 (約 300,000 像素) 的圖片。

實務上，640x480 像素的標準大小在大多數情況下都適用。如果圖片大小超過 640x480 像素，準確度可能不會大幅提升，但輸送量會大幅降低。請盡可能預先處理圖片，將圖片大小縮減至這些最低標準。

建議大小會因偵測到的特徵而異。舉例來說，FACE_DETECTION 要求通常需要較大的圖片大小，因為偵測到的特徵 (臉部) 比圖片小。LABEL_DETECTION要求則通常會評估整張圖片。

下表列出 Vision API 功能要求的類型，以及建議的圖片大小：

Vision API 功能	建議大小	附註
`FACE_DETECTION`	1600x1200	雙眼之間的距離最為重要。
`LANDMARK_DETECTION`	640x480	-
`LOGO_DETECTION`	640x480	-
`LABEL_DETECTION`	640x480	-
`TEXT_DETECTION` 和 `DOCUMENT_TEXT_DETECTION`	1024x768	光學字元辨識需要更高解析度才能偵測字元。
`SAFE_SEARCH_DETECTION`	640x480	-

Vision API 需要夠大的圖片，才能辨識重要特徵。小於或大於建議大小的圖片也可以使用，不過，較小的尺寸可能會導致準確度降低，而較大的尺寸可能會增加處理時間和頻寬用量，但準確度不會成比例提升。如要進行 OCR 分析，圖片大小不得超過 75,000,000 像素 (長度 x 寬度)。如果圖片超過此限制，Vision API 會調整大小；否則，Vision API 會使用原始圖片。

圖片和檔案大小

傳送至 Vision API 的圖片檔不得超過 20 MB。如果檔案超過 20 MB，系統會產生錯誤。Vision API 不會調整此大小的檔案。

如要縮短查詢延遲時間，請縮減檔案大小。但請避免在這項程序中降低圖片品質。

Vision API 的 JSON 要求大小上限為 10 MB。請將較大的檔案託管在 Cloud Storage 或網路上，而不是在 JSON 中以 base64 編碼內容的形式傳遞。

支援的圖片格式和尺寸 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

檔案格式

圖片尺寸建議

圖片和檔案大小

支援的圖片格式和尺寸