Document AI משתמש ב-Enterprise Knowledge Graph כדי לבצע נורמליזציה של תוצאות החילוץ של ישויות (בשדות נתמכים) ולהעשיר אותן. לדוגמה, הכתובות 123 Main St Apt 1 ו-123 Main street # 1 יכולות להיות מנורמלות לאותה כתובת סטנדרטית.
לכל שדה נתמך, Document AI מחזיר גם normalizedValue בנוסף לשדה הגולמי שחולץ, ומנרמל את הטקסט המילולי.
הקובץ מכיל את הנתונים בפורמט סטנדרטי כדי לצמצם את העיבוד שאחרי.
רוב הנתונים שייכים לאחת מהקטגוריות הבאות:
- כסף
- תאריך
- חותמת הזמן
- כתובת
- בוליאני
- מספר שלם
- Float
דוגמה לתשובה
הערכים המועשרים מופיעים בשדה entities.normalizedValue, כמו בדוגמה הבאה שמוצגת בחלקה:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
בדוגמה, המקור employer_name Google Singapore עבר נרמול ל-Google Asia Pacific, Singapore.
במסוף Google Cloud , השדות שעברו העשרה ונירמול מסומנים ב-G. לדוגמה:
מעבדים נתמכים
אלה המעבדים והשדות שתומכים בהעשרת ישויות.
| מעבדים | שדות מועשרים | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
מנתח דפי חשבון בנק
|
|
||||||||||||
W2 Parser
|
|
||||||||||||
מנתח של תלושי שכר
|
|
||||||||||||
מנתח הוצאות
|
|
||||||||||||
כלי לניתוח חשבוניות
|
|