פורמטים של קבצים
Vision API תומך בסוגי התמונות הבאים:
- JPEG
- PNG8
- PNG24
- GIF
- GIF מונפש (הפריים הראשון בלבד)
- BMP
- WEBP
- RAW
- ICO
- TIFF
שימו לב שחלק מפורמטי התמונות האלה הם 'דחיסה עם אובדן נתונים' (לדוגמה, JPEG). הקטנת גודל הקובץ בפורמטים כאלה עלולה לגרום לירידה באיכות התמונה, וכתוצאה מכך לפגוע בדיוק של Vision API.
גודל התמונה
כדי לאפשר זיהוי מדויק של תמונות ב-Vision API, התמונות צריכות להיות בדרך כלל ברזולוציה של לפחות 640 x 480 פיקסלים (כ-300k פיקסלים). בהמשך מוצגים פרטים מלאים על סוגים שונים של בקשות תכונות של Vision API:
| תכונה של Vision API | גודל מומלץ * | הערות |
|---|---|---|
| FACE_DETECTION | 1600 x 1200 | המרחק בין העיניים הוא הכי חשוב |
| LANDMARK_DETECTION | 640 x 480 | |
| LOGO_DETECTION | 640 x 480 | |
| LABEL_DETECTION | 640 x 480 | |
| TEXT_DETECTION ו-DOCUMENT_TEXT_DETECTION | 1,024 x 768 | נדרשת רזולוציה גבוהה יותר ל-OCR כדי לזהות תווים |
| SAFE_SEARCH_DETECTION | 640 x 480 |
הגדלים המומלצים האלה משתנים בהתאם לתכונה שמזוהה. לדוגמה,
בבקשות של FACE_DETECTION נדרשים בדרך כלל גדלים גדולים יותר של תמונות, כי התכונות שמזוהות (פנים) קטנות יותר מהתמונה עצמה.
לעומת זאת, בדרך כלל מתבצעת הערכה של תמונה שלמה בבקשות מסוג LABEL_DETECTION.
בפועל, גודל סטנדרטי של 640x480 פיקסלים מתאים לרוב המקרים. גדלים גדולים יותר לא משפרים משמעותית את הדיוק, אבל הם מקטינים מאוד את קצב העברת הנתונים. אם אפשר, כדאי לעבד מראש את התמונות כדי להקטין את הגודל שלהן בהתאם לסטנדרטים המינימליים האלה.
גודל הקובץ
הגודל המקסימלי של קובצי תמונות שנשלחים אל Vision API הוא 20MB. אם הקבצים גדולים מ-20MB, תוצג שגיאה. ממשק Vision API לא משנה את הגודל של קבצים בגודל הזה. הקטנת גודל הקובץ יכולה לשפר משמעותית את קצב העברת הנתונים, אבל חשוב להקפיד לא לפגוע באיכות התמונה בתהליך. שימו לב: ב-Vision API יש מגבלת גודל של 10MB לבקשת JSON. קבצים גדולים יותר צריכים להיות מאוחסנים ב-Cloud Storage או באינטרנט, ולא להיות מועברים כתוכן בקידוד base64 ב-JSON עצמו.