Descripción general del análisis de contribuciones
Usa este documento para comprender el caso de uso del análisis de contribución y las opciones para realizarlo en BigQuery ML.
¿Qué es el análisis de contribuciones?
El análisis de contribución, también llamado análisis de impulsores clave, es un método que se usa para generar estadísticas sobre los cambios en las métricas clave de tus datos multidimensionales. Por ejemplo, puedes usar el análisis de contribución para ver qué datos contribuyeron a un cambio en las cifras de ingresos en dos trimestres o para comparar dos conjuntos de datos de entrenamiento y comprender los cambios en el rendimiento de un modelo de AA.
El análisis de contribuciones es una forma de análisis aumentado, que consiste en el uso de la inteligencia artificial (IA) para mejorar y automatizar el análisis y la comprensión de los datos. El análisis de contribuciones logra uno de los objetivos clave de las estadísticas avanzadas, que es ayudar a los usuarios a encontrar patrones en sus datos.
Análisis de contribuciones con BigQuery ML
Para usar el análisis de contribución en BigQuery ML, crea un modelo de análisis de contribución con la sentencia CREATE MODEL
.
Un modelo de análisis de contribución detecta segmentos de datos que muestran cambios en una métrica determinada comparando un conjunto de datos de prueba con un conjunto de datos de control. Por ejemplo, puedes usar una instantánea de tabla de los datos de ventas tomada a fines de 2023 como datos de prueba y una instantánea de tabla tomada a fines de 2022 como datos de control, y compararlos para ver cómo cambiaron tus ventas con el tiempo. Un modelo de análisis de contribución podría mostrarte qué segmento de datos, como los clientes en línea de una región en particular, generó el mayor cambio en las ventas de un año a otro.
Una métrica es el valor numérico que usan los modelos de análisis de contribución para medir y comparar los cambios entre los datos de prueba y control. Puedes especificar los siguientes tipos de métricas con un modelo de análisis de contribución:
- Summable: Suma los valores de una columna de métricas que especifiques y, luego, determina un total para cada segmento de los datos.
- Proporción sumable: Suma los valores de dos columnas numéricas que especifiques y determina la proporción entre ellas para cada segmento de los datos.
- Se puede sumar por categoría: Suma el valor de una columna numérica y lo divide por la cantidad de valores distintos de una columna categórica.
Un segmento es una porción de los datos que se identifica mediante una combinación determinada de valores de dimensión. Por ejemplo, para un modelo de análisis de contribución basado en las dimensiones store_number
, customer_id
y day
, cada combinación única de esos valores de dimensión representa un segmento. En la siguiente tabla, cada fila representa un segmento diferente:
store_number |
customer_id |
day |
tienda 1 | ||
tienda 1 | cliente 1 | |
tienda 1 | cliente 1 | Lunes |
tienda 1 | cliente 1 | Martes |
tienda 1 | cliente 2 | |
tienda 2 |
Para reducir el tiempo de creación del modelo, especifica un umbral de apoyo a priori. Un umbral de apoyo a priori te permite eliminar los segmentos pequeños y menos relevantes para que el modelo solo use los segmentos más grandes y relevantes.
Después de crear un modelo de análisis de contribución, puedes usar la función ML.GET_INSIGHTS
para recuperar la información de métricas que calcula el modelo. El resultado del modelo consta de filas de estadísticas, en las que cada estadística corresponde a un segmento y proporciona las métricas correspondientes del segmento.
Recorrido del usuario del análisis de contribuciones
En la siguiente tabla, se describen las instrucciones y las funciones que puedes usar con los modelos de análisis de contribución:
Creación de modelos | Procesamiento previo de atributos | Generación de estadísticas | Instructivos |
---|---|---|---|
CREATE MODEL |
Procesamiento previo manual | ML.GET_INSIGHTS |
¿Qué sigue?
- Cómo crear un modelo de análisis de contribución
- Obtén estadísticas de datos a partir de un modelo de análisis de contribuciones