תמונות נתמכות

פורמטים של קבצים

‫Vision API תומך בסוגי התמונות הבאים:

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • ‫GIF מונפש (הפריים הראשון בלבד)
  • BMP
  • WEBP
  • RAW
  • ICO
  • PDF
  • TIFF

שימו לב שחלק מפורמטי התמונות האלה הם 'דחיסה עם אובדן נתונים' (לדוגמה, JPEG). הקטנת גודל הקובץ בפורמטים כאלה עלולה לגרום לירידה באיכות התמונה, וכתוצאה מכך לפגוע בדיוק של Vision API.

גודל התמונה

כדי לאפשר זיהוי מדויק של תמונות ב-Vision API, התמונות צריכות להיות בדרך כלל ברזולוציה של לפחות ‎640 x 480 פיקסלים (כ-300k פיקסלים). בהמשך מוצגים פרטים מלאים על סוגים שונים של בקשות תכונות של Vision API:

תכונה של Vision API גודל מומלץ * הערות
FACE_DETECTION 1600 x 1200 המרחק בין העיניים הוא הכי חשוב
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION ו-DOCUMENT_TEXT_DETECTION ‎1,024 x 768 נדרשת רזולוציה גבוהה יותר ל-OCR כדי לזהות תווים
SAFE_SEARCH_DETECTION 640 x 480

הגדלים המומלצים האלה משתנים בהתאם לתכונה שמזוהה. לדוגמה, בבקשות של FACE_DETECTION נדרשים בדרך כלל גדלים גדולים יותר של תמונות, כי התכונות שמזוהות (פנים) קטנות יותר מהתמונה עצמה. לעומת זאת, בדרך כלל מתבצעת הערכה של תמונה שלמה בבקשות מסוג LABEL_DETECTION.

בפועל, גודל סטנדרטי של 640x480 פיקסלים מתאים לרוב המקרים. גדלים גדולים יותר לא משפרים משמעותית את הדיוק, אבל הם מקטינים מאוד את קצב העברת הנתונים. אם אפשר, כדאי לעבד מראש את התמונות כדי להקטין את הגודל שלהן בהתאם לסטנדרטים המינימליים האלה.

גודל הקובץ

הגודל המקסימלי של קובצי תמונות שנשלחים אל Vision API הוא 20MB. אם הקבצים גדולים מ-20MB, תוצג שגיאה. ממשק Vision API לא משנה את הגודל של קבצים בגודל הזה. הקטנת גודל הקובץ יכולה לשפר משמעותית את קצב העברת הנתונים, אבל חשוב להקפיד לא לפגוע באיכות התמונה בתהליך. שימו לב: ב-Vision API יש מגבלת גודל של 10MB לבקשת JSON. קבצים גדולים יותר צריכים להיות מאוחסנים ב-Cloud Storage או באינטרנט, ולא להיות מועברים כתוכן בקידוד base64 ב-JSON עצמו.