Elige una función de procesamiento de documentos
En este documento, se proporciona una comparación de las funciones de procesamiento de documentos disponibles en BigQuery ML, que son ML.GENERATE_TEXT
y ML.PROCESS_DOCUMENT
.
Puedes usar la información de este documento para decidir qué función usar en los casos en que las funciones tengan capacidades superpuestas.
A grandes rasgos, la diferencia entre estas funciones es la siguiente:
ML.GENERATE_TEXT
es una buena opción para realizar tareas de procesamiento de lenguaje natural (PNL) en las que parte del contenido reside en documentos. Esta función ofrece los siguientes beneficios:- Bajar los costos
- Compatibilidad con más idiomas
- Mayor capacidad de procesamiento
- Capacidad de ajuste del modelo
- Disponibilidad de modelos multimodales
Para ver ejemplos de tareas de procesamiento de documentos que funcionan mejor con este enfoque, consulta Explora las capacidades de procesamiento de documentos con la API de Gemini.
ML.PROCESS_DOCUMENT
es una buena opción para realizar tareas de procesamiento de documentos que requieren el análisis de documentos y una respuesta estructurada predefinida.
Comparación de funciones
Usa la siguiente tabla para comparar las funciones ML.GENERATE_TEXT
y ML.PROCESS_DOCUMENT
:
ML.GENERATE_TEXT |
ML.PROCESS_DOCUMENT |
|
---|---|---|
Objetivo | Realiza cualquier tarea de PNL relacionada con documentos pasando una instrucción a un modelo de Gemini o de socio o a un modelo abierto. Por ejemplo, dado un documento financiero de una empresa, puedes recuperar información del documento proporcionando una instrucción como |
Usa la API de Document AI para realizar un procesamiento de documentos especializado para diferentes tipos de documentos, como facturas, formularios fiscales y estados financieros. También puedes realizar la fragmentación de documentos. |
Facturación | Genera cargos de BigQuery ML por los datos procesados. Para obtener más información, consulta los precios de BigQuery ML. |
Genera cargos de BigQuery ML por los datos procesados. Para obtener más información, consulta los precios de BigQuery ML.
Genera cargos por las llamadas a la API de Document AI. Para obtener más información, consulta los precios de la API de Document AI. |
Solicitudes por minuto (RPM) | No se aplica a los modelos de Gemini. Entre 25 y 60 para los modelos de socios Para obtener más información, consulta Límites de solicitudes por minuto. | 120 RPM por tipo de procesador, con un límite general de 600 RPM por proyecto. Para obtener más información, consulta la lista de cuotas. |
Tokens por minuto | Varía de 8,192 a más de 1 millón, según el modelo utilizado. | No hay límite de tokens. Sin embargo, esta función tiene límites de páginas diferentes según el procesador que uses. Para obtener más información, consulta Límites. |
Ajuste supervisado | El ajuste supervisado es compatible con algunos modelos. | No compatible. |
Idiomas compatibles | La asistencia varía según el LLM que elijas. | La compatibilidad con idiomas depende del tipo de procesador de documentos; la mayoría solo admite inglés. Para obtener más información, consulta la lista de procesadores. |
Regiones admitidas | Se admite en todas las regiones de la IA generativa para Vertex AI. | Es compatible con las multirregiones EU y US para todos los procesadores. Algunos procesadores también están disponibles en ciertas regiones únicas. Para obtener más información, consulta Compatibilidad regional y multirregional. |