קבצים נתמכים

סוגי קבצים

‫Document AI תומך בסוגי התמונות הבאים.

מידע על מגבלות גודל של קבצים ומגבלות על מספר הדפים מופיע בדף מכסות ומגבלות.

שם סיומת הקובץ סוג MIME
‫Portable Document Format (PDF) .pdf application/pdf
פורמט GIF .gif image/gif
פורמט Tag Image File Format‏ (TIFF) .tiff, .tif image/tiff
Joint Photographic Experts Group ‏ (JPEG) .jpg, .jpeg image/jpeg
Portable Network Graphics ‏ (PNG) .png image/png
מפת סיביות (BMP) .bmp image/bmp
WebP .webp image/webp
HyperText Markup Language ‏ (HTML) .html text/html
‫Microsoft Word Office Open XML‏ (OOXML) .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document
Microsoft PowerPoint OOXML .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation
Microsoft Excel OOXML .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet

חשוב לשים לב שחלק מפורמטי התמונות האלה הם 'דחיסה עם אובדן נתונים' (לדוגמה, JPEG). הקטנת גודל הקובץ בפורמטים עם אובדן נתונים עלולה לגרום לירידה באיכות התמונה ובדיוק התוצאות מ-Document AI.

רזולוציית סריקת המסמכים

כדי לקבל תוצאות מדויקות ביותר מ-OCR ב-Document AI, הסריקות של המסמכים צריכות להיות ברזולוציה של לפחות 200 dpi (נקודות לאינץ'). בדרך כלל, התוצאות הכי טובות מתקבלות ברזולוציה של 300dpi ומעלה. רמת הדיוק של ה-OCR תלויה ברזולוציה ובגודל הגופן המינימלי, וגם בגורמים אחרים כמו איכות המסמך (ואם מדובר בכתב יד, איכות כתב היד), ולכן מומלץ לבצע בדיקה. התכונה ניתוח איכות התמונה יכולה לעזור להעריך בעיות שקשורות לרזולוציה.

הערה: כדי שיהיה אפשר לקרוא את הברקוד, התמונה של גב רישיון הנהיגה בארה"ב צריכה להיות ברזולוציה של 2,000x3,000 פיקסלים.