אתם יכולים להשתמש ב-Document AI כדי להגדיר כללים עסקיים מותאמים אישית לאימות התוצאות של עיבוד המסמכים. אימות הוא תהליך עיבוד מסמכים שבו מופעלים כללי האימות על הישויות הסופיות שחולצו. תיקון הוא תהליך אופציונלי שמנסה לשפר את תוצאות החילוץ על סמך התוצאות של כללי האימות, כדי להגדיל את דיוק החילוץ.
כללי אימות יכולים, למשל, לבדוק אם סכום מחירי הפריטים שווה לערך הכולל, לוודא שהשדות עקביים במספר מסמכים או לוודא שהשדות שחולצו מיושרים במרחב בפריסה (למשל, בתוך בלוק אופקי). אפשר להגדיר כללים עסקיים באמצעות Common Expression Language (CEL) וליצור אותם מהנחיות בשפה טבעית.
הפעלת אימות ותיקון
אפשר להפעיל אימות ותיקון בנפרד במסוף Document AI. ההגדרות האלה חלות על כל הבקשות מסוג processDocument לגרסת המעבד שנבחרה. עם זאת, אפשר לשנות את ההתנהגות הזו עבור בקשות ספציפיות באמצעות פרמטרים בקריאה ל-API processDocument.
הגדרות האימות והתיקון, כולל כללי האימות, ספציפיות לכל גרסה של מעבד. חשוב לזכור שלכל הגרסאות של מעבדים שאומנו מראש ומנוהלים על ידי Google יש הגדרת בסיס משותפת. כשיוצרים גרסה חדשה של מעבד מותאם אישית (למשל, באמצעות כוונון עדין), Document AI משכפל את הגדרות הבסיס ומצרף אותן לגרסה החדשה.
כשהאימות מופעל, התוצאות של כל כללי האימות המוגדרים נכללות בתגובה ProcessDocument גם לבקשות סינכרוניות וגם לבקשות אצווה.
אפשר להפעיל את התיקון רק אם האימות מופעל גם הוא. Document AI מפעיל את תהליך התיקון רק אם לפחות אחד מכללי האימות נכשל עבור מסמך נתון. אחרי התיקון, Document AI מריץ מחדש את תהליך האימות כדי לספק את התוצאות הסופיות. תוצאות האימות לפני התיקון ואחריו זמינות בתגובה processDocument ברשימת תיקונים.
כללי אימות של CEL
כללי האימות מוגדרים באמצעות ביטויים שמבוססים על Common Expression Language (CEL). CEL היא שפת ביטויים לא שלמה של טיורינג, שנועדה להיות פשוטה ובטוחה. דוגמאות לכללים שאפשר להגדיר:
- סכום השדות
Aשווה לשדהB. - השדה
Bתואם לדפוס של ביטוי רגולרי שצוין. - כל שדות המשנה של כל ישות אם מיושרים אופקית.
כדי לפשט את יצירת הכללים, אפשר ליצור כללי CEL על ידי הזנת הנחיות בשפה טבעית. הגישה הזו מאפשרת להימנע מהמורכבות של תחביר CEL. יכול להיות שיהיו הבדלים קלים בין ההטמעה של CEL ב-Document AI לבין המפרט הרגיל. תיאורים מפורטים ודוגמאות זמינים במאמר הפניה לכללי CEL.
הפעלת אימות במסוף Google Cloud
במסוף Google Cloud של מעבד קיים, בוחרים באפשרות אימות ותיקון.

לפני עיבוד מסמך, עוברים אל ניהול כללים.

מעבירים את המתג הפעלת אימות למצב מופעל.
אופציונלי: מפעילים את המתג הפעלת תיקון.
יצירה של כלל
לוחצים על הוספת כלל.

בטופס ליצירת כלל, מזינים הנחיה בשפה טבעית.

נותנים לכלל שם ומשתמשים ב-Common Expression Language (CEL) כדי להגדיר את ההתנהגות.
זה שינוי אופציונלי. כדי לנהל כללים קיימים, משתמשים באפשרויות עריכה או מחיקה.
העתקת ההגדרות בין מעבדים
בקטע ניהול כללים, לוחצים על העתקה ל-PV אחר.

בוחרים את שם המעבד ואת הגרסה שלו כדי להעתיק אליהם את ההגדרה.
תוצאות הכלל
בדף ניהול מערך נתונים, עוברים אל ניהול כללים.

בודקים את המספר הכולל של הבדיקות שעברו בהצלחה ואת הבדיקות שנכשלו.
כדאי לבדוק את פירוט התוצאות של כל כלל בנפרד.
אפשר להשוות בין השינויים כדי לראות אילו ישויות חדשות נוצרו אחרי התיקון (בצבע ירוק) ואילו ישויות שונו (בצבע צהוב).

בקטע Evaluate & test (הערכה ובדיקה), יופיעו עמודות עם ציונים לפני הפעלת התיקון ואחריו.

הערכה
הערכות של גרסת המעבד כוללות מדדים מרכזיים גם לתוצאות אחרי התיקון וגם לתוצאות לפני התיקון, אם התיקון מופעל. אפשר להשתמש במדדים האלה כדי להעריך את ההשפעה של תהליך התיקון על איכות החילוץ.
המאמרים הבאים
- מידע נוסף על חילוץ סכימה
- מידע נוסף על זיהוי חתימות נגזרות