העשרה

‫Document AI משתמש ב-Enterprise Knowledge Graph כדי לבצע נורמליזציה של תוצאות החילוץ של ישויות (בשדות נתמכים) ולהעשיר אותן. לדוגמה, הכתובות 123 Main St Apt 1 ו-123 Main street # 1 יכולות להיות מנורמלות לאותה כתובת סטנדרטית.

לכל שדה נתמך, Document AI מחזיר גם normalizedValue בנוסף לשדה הגולמי שחולץ, ומנרמל את הטקסט המילולי. הקובץ מכיל את הנתונים בפורמט סטנדרטי כדי לצמצם את העיבוד שאחרי.

רוב הנתונים שייכים לאחת מהקטגוריות הבאות:

  • כסף
  • תאריך
  • חותמת הזמן
  • כתובת
  • בוליאני
  • מספר שלם
  • Float

דוגמה לתשובה

הערכים המועשרים מופיעים בשדה entities.normalizedValue, כמו בדוגמה הבאה שמוצגת בחלקה:

{
  "entities": [
    {
      "textAnchor": {
        "textSegments": [ ... ],
        "content": "Google Singapore"
      },
      "type": "employer_name",
      "mentionText": "Google Singapore",
      "confidence": 0.69933707,
      "pageAnchor": {
        "pageRefs": [
          {
            "boundingPoly": {
              "normalizedVertices": [ ... ]
            }
          }
        ]
      },
      "id": "9",
      "normalizedValue": {
        "text": "Google Asia Pacific, Singapore"
      }
    }
  ]
}

בדוגמה, המקור employer_name Google Singapore עבר נרמול ל-Google Asia Pacific, Singapore.

במסוף Google Cloud , השדות שעברו העשרה ונירמול מסומנים ב-G. לדוגמה:

העשרה
דוגמה לשדה שעבר נורמליזציה ומוצג באפליקציית האינטרנט.

מעבדים נתמכים

אלה המעבדים והשדות שתומכים בהעשרת ישויות.

מעבדים שדות מועשרים

מנתח דפי חשבון בנק

קטגוריה מאומן מראש
סוג הפתרון הלוואות
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • bank_address
  • bank_name

W2 Parser

קטגוריה מאומן מראש
סוג הפתרון הלוואות
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • EmployerNameAndAddress
  • EIN

מנתח של תלושי שכר

קטגוריה מאומן מראש
סוג הפתרון הלוואות
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • employer_address
  • employer_name

מנתח הוצאות

קטגוריה מאומן מראש
סוג הפתרון רכש
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • supplier_address
  • supplier_name
  • supplier_phone

כלי לניתוח חשבוניות

קטגוריה מאומן מראש
סוג הפתרון רכש
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • supplier_address
  • supplier_name
  • supplier_phone