Descripción general del procesamiento previo de atributos

El procesamiento previo de atributos es uno de los pasos más importantes del ciclo de vida del aprendizaje automático. Consiste en crear atributos y limpiar los datos de entrenamiento. La creación de atributos también se conoce como ingeniería de atributos.

BigQuery ML proporciona las siguientes técnicas de procesamiento previo de atributos:

  • Procesamiento previo automático BigQuery ML realiza el procesamiento previo automático durante el entrenamiento. Para obtener más información, consulta Procesamiento previo automático de atributos.

  • Procesamiento previo manual: Puedes usar la cláusula TRANSFORM en la declaración CREATE MODEL para definir el procesamiento previo personalizado con las funciones de procesamiento previo manual. También puedes usar estas funciones fuera de la cláusula TRANSFORM para procesar los datos de entrenamiento antes de crear el modelo.

Obtén información sobre los atributos

Puedes usar la función ML.FEATURE_INFO para recuperar las estadísticas de todas las columnas de atributos de entrada.

Si usas la configuración predeterminada en las sentencias CREATE MODEL y las funciones de inferencia, puedes crear y usar modelos de BigQuery ML incluso sin tener muchos conocimientos sobre AA. Sin embargo, tener conocimientos básicos sobre el ciclo de vida del desarrollo de AA, como el ingeniería de atributos y el entrenamiento de modelos, te ayuda a optimizar tanto tus datos como tu modelo para ofrecer mejores resultados. Te recomendamos que uses los siguientes recursos para familiarizarte con las técnicas y los procesos de AA:

¿Qué sigue?