Procesamiento previo manual de atributos
Puedes usar la cláusula TRANSFORM de la declaración CREATE MODEL en combinación con las funciones de procesamiento previo manual para definir el procesamiento previo de los datos personalizados. También puedes usar estas funciones de procesamiento previo manual fuera de la cláusula TRANSFORM.
Si deseas separar el procesamiento previo de datos de entrenamiento de modelos, puedes crear un modelo de solo transformación que solo realice transformaciones de datos mediante la cláusula TRANSFORM.
Puedes usar la función ML.TRANSFORM para aumentar la transparencia del procesamiento previo de atributos. Esta función te permite mostrar los datos procesados previamente desde la cláusula TRANSFORM de un modelo para que puedas ver los datos de entrenamiento reales que se incluyen en el entrenamiento del modelo, así como los datos de predicción reales que en la entrega del modelo.
Para obtener información sobre la compatibilidad de procesamiento previo de atributos en BigQuery ML, consulta Descripción general del procesamiento previo de atributos.
Tipos de funciones de procesamiento previo
Existen varios tipos de funciones de procesamiento previo manual:
- Las funciones escalares operan en una sola fila. Por ejemplo, . Por ejemplo,
ML.BUCKETIZE. - Las funciones con valores de tabla operan en todas las filas y generan una tabla. Por ejemplo,
ML.FEATURES_AT_TIME. Las funciones analíticas operan en todas las filas y generan el resultado para cada fila según las estadísticas recopiladas en todas las filas. Por ejemplo,
ML.QUANTILE_BUCKETIZE.Siempre debes usar una cláusula vacía
OVER()con funciones analíticas de AA.Cuando se utilizan funciones analíticas de ML dentro de la cláusula
TRANSFORMdurante el entrenamiento, las mismas estadísticas se aplican automáticamente a la entrada en la predicción.
Funciones generales
Funciones generales
Usa la siguiente función en expresiones numéricas o de cadena para realizar una limpieza de datos:
Funciones numéricas
Usa las siguientes funciones en expresiones numéricas para regular datos:
ML.BUCKETIZEML.MAX_ABS_SCALERML.MIN_MAX_SCALERML.NORMALIZERML.POLYNOMIAL_EXPANDML.QUANTILE_BUCKETIZEML.ROBUST_SCALERML.STANDARD_SCALER
Usa las siguientes funciones en datos categóricos:
Funciones de texto
Usa las siguientes funciones en las expresiones de cadena de texto:
Usa las siguientes funciones en las expresiones de cadena de texto:
Funciones de imágenes
Usa las siguientes funciones en datos de imágenes:
Limitaciones conocidas
- BigQuery ML admite el procesamiento previo automático y el manual
en la exportación del modelo. Consulta
los tipos de datos admitidos
y las funciones
para exportar modelos entrenados con la
cláusula
TRANSFORMde BigQuery ML.
Para obtener más información sobre las instrucciones y funciones de SQL compatibles para modelos que admiten el procesamiento previo manual de atributos, consulta los siguientes documentos:
Recorridos del usuario de extremo a extremo para modelos de AA
- Recorridos del usuario de extremo a extremo para modelos de AA
- Recorrido del usuario del análisis de contribuciones