יש פורמטים ספציפיים של תמונות, מידות תמונה וגדלי קבצים שאפשר לשלוח ל-Cloud Vision. השתמשו בהנחיות האלה כדי לוודא שזיהוי התכונות יעיל כשמשתמשים ב-Vision API.
פורמטים של קבצים
Vision API תומך בסוגי התמונות הבאים:
- JPEG
- PNG8
- PNG24
- GIF
- GIF מונפש (הפריים הראשון בלבד)
- BMP
- WEBP
- RAW
- ICO
- TIFF
חלק מפורמטי התמונות האלה הם עם אובדן נתונים (לדוגמה, JPEG). הקטנת הגודל של קובץ בפורמט דחיסה עם אובדן נתונים עלולה לפגוע באיכות התמונה ובדיוק של Vision API.
המלצות לגבי מידות התמונה
כדי לקבל זיהוי מדויק של תמונות ב-Vision API, צריך להשתמש בתמונות בגודל של לפחות 640x480 פיקסלים (כ-300,000 פיקסלים).
בפועל, גודל סטנדרטי של 640x480 פיקסלים מתאים לרוב המקרים. תמונות בגודל של יותר מ-640x480 פיקסלים לא בהכרח ישפרו את הדיוק, אבל הן עלולות להקטין משמעותית את קצב העברת הנתונים. אם אפשר, כדאי לעבד מראש את התמונות כדי להקטין את הגודל שלהן בהתאם לדרישות המינימליות האלה.
הגדלים המומלצים הבאים משתנים בהתאם לתכונה שזוהתה. לדוגמה,
בבקשות של FACE_DETECTION נדרשים בדרך כלל גדלים גדולים יותר של תמונות כי התכונות שזוהו (פנים) קטנות יותר מהתמונה. LABEL_DETECTION
לעומת זאת, בבקשות בדרך כלל מתבצעת הערכה של תמונה שלמה.
בטבלה הבאה מפורטים סוגים של בקשות לתכונות של Vision API וגדלי התמונות המומלצים שלהן:
| תכונה של Vision API | גודל מומלץ | הערות |
|---|---|---|
FACE_DETECTION |
1600x1200 | המרחק בין העיניים הוא החשוב ביותר. |
LANDMARK_DETECTION |
640x480 | - |
LOGO_DETECTION |
640x480 | - |
LABEL_DETECTION |
640x480 | - |
TEXT_DETECTION וגם DOCUMENT_TEXT_DETECTION |
1024x768 | כדי לזהות תווים, ה-OCR צריך רזולוציה גבוהה יותר. |
SAFE_SEARCH_DETECTION |
640x480 | - |
Vision API דורש תמונות גדולות מספיק כדי להבחין בתכונות חשובות. אפשר להשתמש גם בגדלים קטנים או גדולים יותר מהגדלים המומלצים. עם זאת, גדלים קטנים יותר עלולים להוביל לדיוק נמוך יותר, וגדלים גדולים יותר עלולים להגדיל את זמן העיבוד ואת השימוש ברוחב הפס בלי שיפור יחסי בדיוק. לניתוח OCR, גודל התמונה לא יכול להיות יותר מ-75,000,000 פיקסלים (אורך x רוחב). אם התמונה חורגת מהמגבלה הזו, Vision API משנה את הגודל שלה. אחרת, Vision API משתמש בתמונה המקורית.
גודל התמונה והקובץ
הגודל של קובצי תמונה שנשלחים אל Vision API לא יכול להיות יותר מ-20 MB. קובץ גדול מ-20 MB יוצר שגיאה. Vision API לא משנה את הגודל של קבצים בגודל הזה.
כדי לשפר את זמן האחזור של השאילתה, כדאי להקטין את גודל הקובץ. עם זאת, חשוב להימנע מהפחתת איכות התמונה במהלך התהליך הזה.
ב-Vision API יש מגבלת גודל של 10 MB לבקשות JSON. כדאי לארח קבצים גדולים ב-Cloud Storage או באינטרנט, במקום להעביר אותם כתוכן מקודד ב-Base64 ב-JSON עצמו.