Descripción general del análisis de contribuciones
Usa este documento para comprender el caso de uso del análisis de contribución y las opciones para realizarlo en BigQuery ML.
¿Qué es el análisis de contribuciones?
El análisis de contribución, también llamado análisis de impulsores clave, es un método que se usa para generar estadísticas sobre los cambios en las métricas clave de tus datos multidimensionales. Por ejemplo, puedes usar el análisis de contribución para ver qué datos contribuyeron a un cambio en las cifras de ingresos en dos trimestres o para comparar dos conjuntos de datos de entrenamiento y comprender los cambios en el rendimiento de un modelo de AA.
El análisis de contribuciones es una forma de análisis aumentado, que consiste en el uso de la inteligencia artificial (IA) para mejorar y automatizar el análisis y la comprensión de los datos. El análisis de contribuciones logra uno de los objetivos clave de las estadísticas avanzadas, que es ayudar a los usuarios a encontrar patrones en sus datos.
Análisis de contribuciones con BigQuery ML
El análisis de contribución detecta segmentos de datos que muestran cambios en una métrica determinada comparando un conjunto de datos de prueba con un conjunto de datos de control. Por ejemplo, puedes usar una instantánea de tabla de los datos de ventas tomada a fines de 2023 como datos de prueba y una instantánea de tabla tomada a fines de 2022 como datos de control, y compararlos para ver cómo cambiaron tus ventas con el tiempo. El análisis de contribución puede mostrarte qué segmento de datos, como los clientes en línea de una región en particular, generó el mayor cambio en las ventas de un año a otro.
Una métrica es el valor numérico que usan los modelos de análisis de contribución para medir y comparar los cambios entre los datos de prueba y control. Puedes especificar los siguientes tipos de métricas con un modelo de análisis de contribución:
- Summable: Suma los valores de una columna de métricas que especifiques y, luego, determina un total para cada segmento de los datos.
- Proporción sumable: Suma los valores de dos columnas numéricas que especifiques y determina la proporción entre ellas para cada segmento de los datos.
- Se puede sumar por categoría: Suma el valor de una columna numérica y lo divide por la cantidad de valores distintos de una columna categórica.
Un segmento es una porción de los datos que se identifica mediante una combinación determinada de valores de dimensión. Por ejemplo, para un modelo de análisis de contribución basado en las dimensiones store_number, customer_id y day, cada combinación única de esos valores de dimensión representa un segmento. En la siguiente tabla, cada fila representa un segmento diferente:
store_number |
customer_id |
day |
| tienda 1 | ||
| tienda 1 | cliente 1 | |
| tienda 1 | cliente 1 | Lunes |
| tienda 1 | cliente 1 | Martes |
| tienda 1 | cliente 2 | |
| tienda 2 |
Analiza datos sin un modelo
Si tienes menos de 12 dimensiones y usas una métrica sumable, puedes realizar un análisis de contribución con la TVF AI.KEY_DRIVERS.
Para la mayoría de las aplicaciones, recomendamos usar la función AI.KEY_DRIVERS en lugar de crear un modelo, ya que ofrece una sintaxis simplificada, resultados más rápidos y poda automática. El resultado de la función consta de filas de estadísticas, en las que cada estadística corresponde a un segmento y proporciona las métricas correspondientes del segmento.
Usa un modelo de análisis de contribuciones
Para realizar análisis repetidos o si necesitas más de 12 dimensiones o otros tipos de métricas, puedes crear un modelo de análisis de contribución con la instrucción CREATE MODEL.
Para reducir el tiempo de creación del modelo, especifica un umbral de apoyo a priori. Un umbral de apoyo a priori te permite eliminar los segmentos pequeños y menos relevantes para que el modelo solo use los segmentos más grandes y relevantes.
Después de crear un modelo de análisis de contribución, puedes usar la función ML.GET_INSIGHTS para recuperar la información de métricas que calcula el modelo. El resultado de la función consta de filas de estadísticas, en las que cada estadística corresponde a un segmento y proporciona las métricas correspondientes del segmento.
Recorrido del usuario del análisis de contribuciones
En la siguiente tabla, se describen las instrucciones y las funciones que puedes usar con el análisis de contribución:
| Instrucción o función | Procesamiento previo de atributos | Generación de estadísticas | Instructivos |
|---|---|---|---|
AI.KEY_DRIVERS |
Procesamiento previo manual | N/A | Ejemplo de análisis de contribuciones sobre los datos de ventas de licor de Iowa |
CREATE MODEL |
Procesamiento previo manual | ML.GET_INSIGHTS |
¿Qué sigue?
- Cómo crear un modelo de análisis de contribución
- Obtén estadísticas de datos a partir de un modelo de análisis de contribuciones