Document AI usa Enterprise Knowledge Graph para normalizar y enriquecer los resultados de la extracción de entidades (para los campos admitidos). Por ejemplo, las direcciones 123 Main St Apt 1 y 123 Main street # 1 se podrían normalizar a la misma dirección estandarizada.
Para cada campo compatible, Document AI también devuelve un normalizedValue, además del campo sin procesar extraído, que normaliza el texto literal.
Contiene los datos en un formato estandarizado para reducir el procesamiento posterior.
La mayoría de los datos pertenecen a una de las siguientes categorías:
- Dinero
- Fecha
- Marca de tiempo
- Dirección
- Booleano
- Número entero
- Número de punto flotante
Respuesta de muestra
Los valores enriquecidos se pueden encontrar en el campo entities.normalizedValue, como se muestra en el siguiente ejemplo truncado:
{
"entities": [
{
"textAnchor": {
"textSegments": [ ... ],
"content": "Google Singapore"
},
"type": "employer_name",
"mentionText": "Google Singapore",
"confidence": 0.69933707,
"pageAnchor": {
"pageRefs": [
{
"boundingPoly": {
"normalizedVertices": [ ... ]
}
}
]
},
"id": "9",
"normalizedValue": {
"text": "Google Asia Pacific, Singapore"
}
}
]
}
En la muestra, el employer_name original "Google Singapore" se normalizó a "Google Asia Pacific, Singapore".
En la consola de Google Cloud , los campos enriquecidos y normalizados se anotan con G. Por ejemplo:
Procesadores compatibles
Estos son los procesadores y los campos que admiten el enriquecimiento de entidades.
| Procesadores | Campos enriquecidos | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Analizador de estados de cuenta
|
|
||||||||||||
Analizador W2
|
|
||||||||||||
Analizador de comprobantes de pago
|
|
||||||||||||
Analizador de gastos
|
|
||||||||||||
Analizador de facturas
|
|