Descripción general del análisis de contribuciones
Usa este documento para comprender el caso de uso del análisis de contribuciones y las opciones para realizarlo en BigQuery ML.
¿Qué es el análisis de contribuciones?
El análisis de contribuciones, también llamado análisis de impulsores clave, es un método que se usa para generar estadísticas sobre los cambios en las métricas clave de tus datos multidimensionales. Por ejemplo, puedes usar el análisis de contribuciones para ver qué datos contribuyeron a un cambio en las cifras de ingresos en dos trimestres o para comparar dos conjuntos de datos de entrenamiento y comprender los cambios en el rendimiento de un modelo de AA.
El análisis de contribuciones es una forma de análisis aumentado, que consiste en el uso de la inteligencia artificial (IA) para mejorar y automatizar el análisis y la comprensión de los datos. El análisis de contribuciones logra uno de los objetivos clave de las estadísticas avanzadas, que es ayudar a los usuarios a encontrar patrones en sus datos.
Análisis de contribuciones con BigQuery ML
El análisis de contribuciones detecta segmentos de datos que muestran cambios en una métrica determinada comparando un conjunto de datos de prueba con un conjunto de datos de control. Por ejemplo, puedes usar una instantánea de tabla de datos de ventas tomada a fines de 2023 como datos de prueba y una instantánea de tabla tomada a fines de 2022 como datos de control, y compararlos para ver cómo cambiaron tus ventas con el tiempo. El análisis de contribuciones puede mostrarte qué segmento de datos, como los clientes en línea de una región en particular, generó el mayor cambio en las ventas de un año a otro.
Una métrica es el valor numérico que usan los modelos de análisis de contribución para medir y comparar los cambios entre los datos de prueba y control. Puedes especificar los siguientes tipos de métricas con un modelo de análisis de contribución:
- Sumable: Suma los valores de una columna de métricas que especificas y, luego, determina un total para cada segmento de los datos.
- Proporción sumable: Suma los valores de dos columnas numéricas que especificas y determina la proporción entre ellas para cada segmento de los datos.
- _Sumable por categoría_: Suma el valor de una columna numérica y lo divide por la cantidad de valores distintos de una columna categórica.
Un segmento es una porción de los datos que se identifica mediante una combinación determinada de valores de dimensión. Por ejemplo, para un modelo de análisis de contribución basado en las dimensiones store_number, customer_id y day, cada combinación única de esos valores de dimensión representa un segmento. En la siguiente tabla, cada fila representa un segmento diferente:
store_number |
customer_id |
day |
| tienda 1 | ||
| tienda 1 | cliente 1 | |
| tienda 1 | cliente 1 | Lunes |
| tienda 1 | cliente 1 | Martes |
| tienda 1 | cliente 2 | |
| tienda 2 |
Analiza datos sin un modelo
Si tienes menos de 12 dimensiones y usas una métrica sumable, entonces puedes
realizar un análisis de contribuciones con la
AI.KEY_DRIVERS TVF.
Para la mayoría de las aplicaciones, recomendamos usar la función AI.KEY_DRIVERS en lugar de crear un modelo, ya que ofrece una sintaxis simplificada, resultados más rápidos y eliminación automática. El resultado de la función consta de filas de estadísticas, en las que cada estadística corresponde a un segmento y proporciona las métricas correspondientes del segmento.
Usa un modelo de análisis de contribuciones
Si necesitas más de 12 dimensiones o tipos
de métricas, puedes crear un modelo de análisis de contribuciones con la
CREATE MODEL instrucción.
Para reducir el tiempo de creación del modelo, especifica un umbral de apoyo a priori. Un umbral de apoyo a priori te permite eliminar segmentos pequeños y menos relevantes para que el modelo use solo los segmentos más grandes y relevantes.
Después de crear un modelo de análisis de contribución, puedes usar la
ML.GET_INSIGHTS función
para recuperar la información de métricas que calcula el modelo. El resultado de la función consta de filas de estadísticas, en las que cada estadística corresponde a un segmento y proporciona las métricas correspondientes del segmento.
Recorrido del usuario del análisis de contribuciones
En la siguiente tabla, se describen las instrucciones y funciones que puedes usar con el análisis de contribuciones:
| Instrucción o función | Procesamiento previo de atributos | Generación de estadísticas | Instructivos |
|---|---|---|---|
AI.KEY_DRIVERS |
Procesamiento previo manual | N/A | Ejemplo de análisis de contribuciones en datos de ventas de licor de Iowa |
CREATE MODEL |
Procesamiento previo manual | ML.GET_INSIGHTS |
¿Qué sigue?
- Cómo crear un modelo de análisis de contribución
- Obtén estadísticas de datos a partir de un modelo de análisis de contribuciones