עיבוד מסמכים באמצעות מעבד של Document AI

במאמר הזה מוסבר איך לעדכן מסמכים קיימים באמצעות תוצאות חדשות שעובדו על ידי מעבד אחר של Document AI.

מגבלות נוכחיות

הצינור ProcessWithDocAi יכול לפעול רק עם מסמכים שעברו עיבוד במהלך ההטמעה. בגרסאות עתידיות של צינור העיבוד, הוא יורחב כך שיכלול מסמכים שעדיין לא עברו עיבוד. כדאי לעקוב אחרי העדכונים בהערות המוצר שלנו.

הגדרת מיפוי סכימה בסכימת מסמך (אדמין בלבד)

במאמר הגדרת סכימות עם מיפוי מוסבר איך להגדיר מאפיינים חדשים או קיימים של סכימת Document AI Warehouse למיפוי עם ישויות שחולצו מ-Document AI. אנחנו מסבירים איך עושים את זה במסוף Admin של Document AI Warehouse.

כניסה למסוף Admin של Document AI Warehouse

מוודאים שיש לכם הרשאת אדמין. אחר כך תוכלו להיכנס למסוף Admin.

קישור לממשק המשתמש לניהול

יצירת סכימה חדשה עם מיפוי סכימה

אפשר ליצור סכימה חדשה עם מיפוי סכימה, ואפשר לבצע את אותם השלבים בסכימות קיימות על ידי עדכון הסכימות בתצוגת פרטי הסכימה. חשוב לזכור שהפונקציות של עדכון הסכימה מוגבלות כרגע. אנחנו לא תומכים בהסרה או בשינוי של מאפיינים קיימים.

  1. בכרטיסייה Schema manager (ניהול סכימות), לוחצים על Add new (הוספת סכימה חדשה):

    שלב 1

  2. מזינים שם תצוגה ותיאור.

    שלב 2

    שימו לב שאי אפשר לשנות את השם לתצוגה אחרי שיוצרים אותו. התיאור הוא אופציונלי ואפשר לעדכן אותו אחרי שהמרחב נוצר.

  3. לוחצים על הבא. מופיע עורך ה-JSON של הסכימה, כולל השם המוצג והתיאור שהזנתם בשלב הקודם.

    שלב 3

    בדוגמה הזו, מוסיפים את המאפיין total_amount לרשימה property_definitions:

        {
            "name": "total_amount",
            "display_name": "Total Amount",
            "is_repeatable": false,
            "is_filterable": true,
            "is_searchable": true,
            "is_metadata": false,
            "is_required": false,
            "float_type_options": {},
            "schema_sources": [
                {
                        "name": "total_amount",
                        "processor_type": "INVOICE_PROCESSOR"
                }
            ]
        }
    

    הנכס מוגדר למיפוי לשדה total_amount שחולץ על ידי INVOICE_PROCESSOR. כדי לקבל את הרשימה המלאה של סוגי המעבדים, אפשר להשתמש ב-API של fetchProcessorTypes.

  4. כדי ליצור סכימה, לוחצים על סיום. בסיום התהליך תופיע הודעת אישור:

    שלב 4

  5. אפשר לראות את הסכימה בפירוט.

    שלב 5

דוגמה: שימוש במעבד חשבוניות למסמכים שעברו OCR

אחרי שמגדירים את מיפוי המאפיינים בסכימה, אפשר לעבד מחדש את המסמכים שעברו עיבוד OCR באמצעות מעבד חשבוניות, שבו המאפיין total_amount ממופה מתוצאות שנותחו.

  1. בוחרים את המסמכים שרוצים לעבד מחדש.

    בוחרים את המסמכים שרוצים להחיל עליהם מעבד אחר. אחר כך לוחצים על חילוץ באמצעות Document AI בסרגל הפעולות.

    שלב 1

    בתיבת הדו-שיח הקופצת יש שלושה שדות להזנת קלט:

    1. מזהה מעבד: מזהה המעבד שבו רוצים להשתמש לעיבוד המסמכים.

    2. נתיב קובץ לייצוא: נתיב של קטגוריית אחסון זמנית לאחסון זמני של המסמכים.

    3. נתיב לתיקיית תוצאות של מעבד: נתיב לקטגוריה לאחסון מסמכים שנותחו על ידי המעבד.

    שלב 2

    כדאי לצמצם את החיפוש או את קריטריוני הסינון.
  2. מזהים את מזהה מעבד החשבוניות.

    בדומה ליצירת כלי לניתוח OCR במדריך להעלאה בכמות גדולה, אפשר ליצור כלי לעיבוד חשבוניות מגלריית המעבדים.

    שלב 3

    המזהה מופיע בדף פרטי המעבד:

    שלב 4

  3. מפעילים את הפייפליין ועוקבים אחרי הסטטוס.

    אחרי שמזינים את המזהה ושני נתיבי הדלי בתיבת הדו-שיח, אפשר ללחוץ על Extract כדי להפעיל את צינור הנתונים:

    שלב 5

  4. אחרי הפעלת צינור הנתונים, מופיע דף למעקב אחר הסטטוס:

    שלב 6

    נכון לעכשיו, אין מעקב פעיל בדף. בדף הסטטוס מופיע סטטוס ההעברה כ'בהמתנה' עד שהמשימה מסתיימת.

  5. בודקים את התוצאות המעודכנות.

    אחרי שהעבודה מסתיימת, אפשר ללחוץ על המסמך כדי לבדוק אם תוצאות החילוץ עודכנו בצורה נכונה.

    Step 7

    אפשר לראות שהנכס total_amount ממופה מתוצאות מנותחות.

    שלב 8

    בתצוגת ה-AI, אפשר למצוא את הרשימה המלאה של הישויות שחולצו:

    שלב 9

השלב הבא

כדי לייצא את המסמכים אל כלי מותאם אישית לחילוץ מסמכים ב-Document AI Workbench, צריך לפעול לפי ההוראות במדריך הבא.