נורמליזציה

בנוסף לשדה הגולמי שחולץ באמצעות textAnchor של כל ישות, Document AI מחזיר גם את entity.normalizedValue עבור הרבה שדות ספציפיים נתמכים. הוא מבצע נורמליזציה של הטקסט המילולי. הנרמול לרוב מפרק את ערך הטקסט לשדות משנה.

הנתונים האלה נשמרים בפורמט סטנדרטי כדי לצמצם את העיבוד שאחרי ההמרה, ולאפשר המרה לכל פורמט שנבחר. הערך mentionText, שמייצג את מה שמופיע בפועל במסמך, אף פעם לא משתנה על ידי נורמליזציה.

שדות שעברו נרמול שייכים לאחת מהקטגוריות הבאות.

ערכים מנורמלים במסוף

במסוף Google Cloud , השדות המנורמלים מסומנים ב-G. לדוגמה:

העשרה
דוגמה לשדה שעבר נורמליזציה ומוצג באפליקציית האינטרנט.

מעבדים נתמכים

אלה המעבדים והשדות שתומכים בהעשרה ובנרמול של ישויות:

מעבדים שדות מנורמלים

מנתח דפי חשבון בנק

קטגוריה מאומן מראש
סוג הפתרון הלוואות
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date

מנתח דרכונים אמריקאיים

קטגוריה מאומן מראש
סוג הפתרון זהות
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • Date Of Birth
  • Expiration Date
  • Issue Date

מנתח כלי עזר

קטגוריה מאומן מראש
סוג הפתרון רכש
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה מוגבלת
פרטים מלאים על המעבד ערך מפורט
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount

כלי לניתוח הוכחות של תעודות מזהות

קטגוריה מאומן מראש
סוג הפתרון זהות
פונקציות OCR, Quality Analysis
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words

מנתח של תלושי שכר

קטגוריה מאומן מראש
סוג הפתרון הלוואות
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd

כלי לניתוח רישיונות נהיגה בארה"ב

קטגוריה מאומן מראש
סוג הפתרון זהות
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • Date Of Birth
  • Expiration Date
  • Issue Date

מנתח הוצאות

קטגוריה מאומן מראש
סוג הפתרון רכש
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount

כלי לניתוח חשבוניות

קטגוריה מאומן מראש
סוג הפתרון רכש
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate

מעבדי חילוץ

הכלי לחילוץ בהתאמה אישית תומך בנרמול של כל הישויות עם סוגי הנתונים הנפוצים הבאים: dateTime,‏ currency,‏ money ו-number. Google Cloud

מעבדים סוגי נתונים שעברו נרמול

חילוץ מותאם אישית

קטגוריה חילוץ
סוג הפתרון בהתאמה אישית
פונקציות OCR, Entity Extraction
שלב ההשקה זמינות כללית
סטטוס הגישה גלוי לכולם
פרטים מלאים על המעבד ערך מפורט
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER