חילוץ מותאם אישית באמצעות AI גנרטיבי

זיהוי של שדה נגזר וחתימה

תכונת השדות הנגזרים בתצוגה מקדימה ציבורית מאפשרת ללקוחות Document AI להגדיר שדה שיאוכלס באמצעות הסקה או יצירה חכמה על סמך הקשר של המסמך, ולא באמצעות חילוץ טקסט ישיר.

בנוסף, בגרסה הזו הוספנו עוד תכונה לזיהוי חתימות במסמכים. אפשר להשתמש בסוג הישות החדש signature כדי לציין סכימה לישויות כאלה. הישויות של החתימה נגזרות באמצעות רמזים ויזואליים מהמסמך.

שדות נגזרים בכלי לחילוץ מותאם אישית

חילוץ מותאם אישית תומך בשדות נגזרים במודלים הבאים:

  • pretrained-foundation-model-v1.4-2025-02-05 כזמינות כללית (GA)
  • pretrained-foundation-model-v1.5-2025-05-05 בתצוגה מקדימה
  • pretrained-foundation-model-v1.5-pro-2025-06-20 בתצוגה מקדימה

אפשר להפעיל את התכונות האלה בממשק המשתמש של המסוף כשיוצרים או עורכים תוויות בסכימת המסמך.

שדות נגזרים היא תכונה עוצמתית שמאפשרת לכם לחלץ מידע שלא כתוב במפורש במסמך. כך אפשר להגדיר ששדה יאוכלס באמצעות הסקה או יצירה חכמה על סמך ההקשר הכללי של המסמך. האפשרות הזו מתקדמת יותר מחילוץ טקסט בסיסי, והיא תומכת בתרחישי שימוש מתקדמים, כמו:

  • הסקת המדינה מכתובת.
  • ספירת המספר הכולל של הפריטים בטבלה.
  • זיהוי אם תעודת הזהות היא 'תעודת זהות אמיתית'.

דוגמה ליצירת סכימה

הנה דוגמה ליצירת סכימה לשדות נגזרים לתרחישי שימוש כאלה, ולפלט הצפוי, באמצעות רישיון נהיגה בארה"ב.

  1. בוחרים בשיטה Derived כשיוצרים רכיב סכימה.

    cde-signature-detection-derived-field-1

  2. כדאי להוסיף תוויות תיאוריות כדי לשפר את הביצועים.

    cde-signature-detection-derived-field-2

  3. כשמתייגים מסמכים, לא צריך להגדיר תיבות תוחמות לשדות נגזרים כמו חתימות. בשדה ערך, בוחרים באפשרות זוהה.

    cde-signature-detection-derived-field-3

  4. בשדות נגזרים שאינם חתימות, אפשר להזין כל ערך כחלק מהוספת התווית כדי להגדיר את הפלטים האפשריים.

    cde-signature-detection-derived-field-4

הפלט הצפוי ייראה בערך כך, עם חתימה שמוחזרת כ-"Detected" או כ-"", ושדות נגזרים שמוחזרים כטקסט בהתאם להנחיות של תיאור התווית.

cde-signature-detection-derived-field-5

סקירה כללית של חילוץ לעומת נגזר

כשמגדירים ישות בסכימת המעבד, אפשר לבחור שיטה לאכלוס הערך שלה.

  • חילוץ: זו שיטת ברירת המחדל. היא פועלת כשצריך לחלץ את הערך של הישות ישירות מטקסט המסמך. המערכת מזהה את הטקסט ומאכלסת שדות כמו textAnchor ו-pageAnchor כדי להציג את המיקום שלו.

  • נגזר: השיטה הזו משמשת כשצריך להסיק את ערך הישות מתוכן המסמך. מכיוון שהערך לא מופיע ישירות בטקסט, השדות textAnchor ו-pageAnchor לא מאוכלסים.

תרחיש שימוש לדוגמה: איתור קוד מטבע

נניח שאתם צריכים לזהות את קוד המטבע (לדוגמה, USD, ‏ CAD, ‏ EUR) של עסקאות במסמכים שלכם.

  • מתי להשתמש ב-Extract: אם המסמכים מכילים באופן עקבי סמלי מטבע או קודי מטבע חד-משמעיים כמו USD או €, כדאי להשתמש בשיטה Extract כדי למצוא ולחלץ את הטקסט המדויק הזה.

  • מתי להשתמש בשיטה Derived: אם במסמך נעשה שימוש בסמל לא חד-משמעי כמו "$" (שיכול להתייחס לדולר אמריקאי, לדולר קנדי, לדולר אוסטרלי וכו') או אם אין סמל בכלל, צריך להשתמש בשיטה Derived. המודל מנתח את ההקשר של המסמך – כמו כתובת לחיוב או מיקום החברה – כדי להסיק מהו קוד המטבע הנכון לפי תקן ISO 4217.

תרחיש לדוגמה: הוראות מותאמות אישית לנורמליזציה

נניח שאתם צריכים לחלץ מידע מהמסמך בפורמט שונה משאר המסמך. רוב התרחישים לדוגמה כבר מטופלים על ידי לוגיקת הנורמליזציה. במקרים חריגים שלא מכוסים, אפשר להחזיר את הישויות האלה בפורמט פלט מותאם אישית שמוגדר באמצעות שדות נגזרים. לדוגמה, אפשר להסיר מקפים ממספרים באמצעות ההנחיה: החזרת המספר ללא כל התווים הלא מספריים.

cde-signature-detection-derived-field-6

באופן דומה, אפשר לבצע נורמליזציה של תאריך החשבונית באמצעות שדה נגזר עם התיאור: החזרת תאריך החשבונית בפורמט yyyy-mm-dd‏ (ISO 8601). פורמט התאריך בחשבונית יהיה פורמט תאריך מקומי. צריך להשתמש במדינה שבה הונפקה החשבונית כדי להסיק את פורמט התאריך המקומי.

שיטות מומלצות להגדרה

כדי לקבל את התוצאות הטובות ביותר עם שדות נגזרים, מומלץ מאוד לכתוב description ברור ומפורט לנכס בסכימה במהלך הוספת התוויות. כך אפשר להנחות את המודל במשימת הגזירה שלו.

בדוגמה של קוד המטבע, אפשר ליצור שדה עם השם currency_code ולספק את התיאור הבא: "תמצא את קוד המטבע לפי תקן ISO 4217 של ערכי הסכומים במסמך, באמצעות אותות הקשר שמופיעים במסמך, כמו סמלי מטבע וכתובות".

מגבלות

שדות נגזרים נוצרים על בסיס כל דף. המשמעות היא שתרחישי שימוש שדורשים מידע מכמה דפים לא נתמכים באופן מלא. לדוגמה, אם מגדירים שדה נגזר לסיכום מסמך, המערכת יוצרת סיכום נפרד לכל דף בנפרד ולא סיכום מגובש אחד לכל המסמך. ההגבלה הזו חלה על כל שדה שבו הערך צריך להיות נגזר ממידע שמתקבל מדפים שונים.

זיהוי חתימות בכלי חילוץ מותאם אישית

הכלי המותאם אישית לחילוץ מסמכים של Document AI תומך בזיהוי חתימות במודלים מותאמים אישית לחילוץ מסמכים pretrained-foundation-model-v1.4-2025-02-05 וב-pretrained-foundation-model-v1.5-2025-05-05. אפשר להפעיל את התכונה הזו בממשק המשתמש של המסוף כשיוצרים או עורכים תוויות בסכימת המסמך.

זיהוי חתימות היא תכונה שמאפשרת לכם לקבוע אם יש חתימה במסמכים. התכונה הזו מאמתת שחתימה קיימת על ידי ניתוח רמזים חזותיים, ולא על ידי חילוץ טקסט.

איך פועל זיהוי החתימה

כדי להפעיל את הפונקציונליות הזו, אפשר להשתמש בסוג הנתונים signature כשמגדירים את סכימת המעבד. ההתנהגות של המעבד תלויה בשאלה אם מזוהה חתימה במסמך.

אם נמצאה חתימה, כלי החילוץ מחזיר ישות חתימה בתגובה שלו. עבור שדה בשם has_signed, לאובייקט התגובה יש את המבנה הבא:

"has_signed": {
  "mention_text": "Detected",
  "confidence": <confidence_score_between 0 to 1>,
  "normalized_value": {
    "text": "Detected",
    "signature_value": true
  }
}

אם לא נמצאה חתימה, הישות לא מוחזרת בתגובה של המעבד.

הגדרה של דרישות מרכזיות

כדי להגדיר זיהוי חתימות:

  1. הגדרת הסכימה: בסכימת המעבד, מוסיפים ישות חדשה לחתימה שרוצים לזהות.
  2. הגדרת סוג הנתונים: בוחרים באפשרות 'חתימה' כסוג הנתונים של הישות החדשה.
  3. הגדרת השיטה כנגזרת: אפשר להשתמש רק בשיטה Derived עבור ישויות עם סוג הנתונים signature. המודל מסיק את נוכחות החתימה באופן ויזואלי, ולכן הוא לא מחלץ ערך טקסט. לכן, שדות כמו textAnchor ו-pageAnchor לא מאוכלסים עבור ישויות חתימה.

תרחיש שימוש לדוגמה

נניח שאתם מעבדים חוזים וצריכים לוודא שהם נחתמו. אפשר ליצור שדה סכימה בשם is_contract_signed ולהגדיר את סוג הנתונים שלו כ-signature. כשמעבדים חוזה חתום, התגובה כוללת ישות is_contract_signed שמאשרת שהחתימה קיימת. אם אין חתימה, הישות הזו לא תופיע בתשובה. כך תוכלו לסמן במהירות מסמכים לא חתומים לבדיקה.

המאמרים הבאים

מידע על שיפור של מעבד ייעודי