סוגי קבצים
Document AI תומך בסוגי התמונות הבאים.
מידע על מגבלות גודל של קבצים ומגבלות על מספר הדפים מופיע בדף מכסות ומגבלות.
| שם | סיומת הקובץ | סוג MIME |
|---|---|---|
| Portable Document Format (PDF) | .pdf |
application/pdf |
| פורמט GIF | .gif |
image/gif |
| פורמט Tag Image File Format (TIFF) | .tiff, .tif |
image/tiff |
| Joint Photographic Experts Group (JPEG) | .jpg, .jpeg |
image/jpeg |
| Portable Network Graphics (PNG) | .png |
image/png |
| מפת סיביות (BMP) | .bmp |
image/bmp |
| WebP | .webp |
image/webp |
| HyperText Markup Language (HTML) | .html |
text/html |
| Microsoft Word Office Open XML (OOXML) | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
| Microsoft PowerPoint OOXML | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
| Microsoft Excel OOXML | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
חשוב לשים לב שחלק מפורמטי התמונות האלה הם 'דחיסה עם אובדן נתונים' (לדוגמה, JPEG). הקטנת גודל הקובץ בפורמטים עם אובדן נתונים עלולה לגרום לירידה באיכות התמונה ובדיוק התוצאות מ-Document AI.
רזולוציית סריקת המסמכים
כדי לקבל תוצאות מדויקות ביותר מ-OCR ב-Document AI, הסריקות של המסמכים צריכות להיות ברזולוציה של לפחות 200 dpi (נקודות לאינץ'). בדרך כלל, התוצאות הכי טובות מתקבלות ברזולוציה של 300dpi ומעלה. רמת הדיוק של ה-OCR תלויה ברזולוציה ובגודל הגופן המינימלי, וגם בגורמים אחרים כמו איכות המסמך (ואם מדובר בכתב יד, איכות כתב היד), ולכן מומלץ לבצע בדיקה. התכונה ניתוח איכות התמונה יכולה לעזור להעריך בעיות שקשורות לרזולוציה.
הערה: כדי שיהיה אפשר לקרוא את הברקוד, התמונה של גב רישיון הנהיגה בארה"ב צריכה להיות ברזולוציה של 2,000x3,000 פיקסלים.