Panoramica dell'analisi del contributo
Utilizza questo documento per comprendere lo scenario d'uso dell'analisi del contributo e le opzioni per eseguire l'analisi del contributo in BigQuery ML.
Che cos'è l'analisi del contributo?
L'analisi del contributo, chiamata anche analisi dei fattori chiave, è un metodo utilizzato per generare insight sulle modifiche alle metriche chiave nei dati multidimensionali. Ad esempio, puoi utilizzare l'analisi del contributo per vedere quali dati hanno contribuito a una variazione dei numeri di entrate in due trimestri o per confrontare due set di dati di addestramento per comprendere le variazioni nelle prestazioni di un modello di ML.
L'analisi del contributo è una forma di analisi aumentata, ovvero l'utilizzo dell'intelligenza artificiale (AI) per migliorare e automatizzare l'analisi e la comprensione dei dati. L'analisi del contributo raggiunge uno degli obiettivi chiave dell'analisi aumentata, ovvero aiutare gli utenti a trovare pattern nei loro dati.
Analisi del contributo con BigQuery ML
L'analisi del contributo rileva i segmenti di dati che mostrano variazioni in una determinata metrica confrontando un test set di dati con un gruppo di controllo di dati. Ad esempio, potresti utilizzare uno snapshot della tabella dei dati di vendita acquisiti alla fine del 2023 come dati di test e uno snapshot della tabella acquisito alla fine del 2022 come dati di controllo e confrontarli per vedere come sono cambiate le vendite nel tempo. L'analisi del contributo può mostrare quale segmento di dati, ad esempio i clienti online in una determinata regione, ha determinato la variazione maggiore delle vendite da un anno all'altro.
Una metrica è il valore numerico utilizzato dai modelli di analisi del contributo per misurare e confrontare le variazioni tra i dati di test e di controllo. Puoi specificare i seguenti tipi di metriche con un modello di analisi del contributo:
- Sommabile: somma i valori di una colonna metrica specificata e poi determina un totale per ogni segmento dei dati.
- Rapporto sommabile: somma i valori di due colonne numeriche specificate e determina il rapporto tra loro per ogni segmento dei dati.
- Sommabile per categoria: somma il valore di una colonna numerica e lo divide per il numero di valori distinti di una colonna categorica.
Un segmento è una porzione dei dati identificata da una determinata combinazione di
valori delle dimensioni. Ad esempio, per un modello di analisi del contributo basato sulle dimensioni
store_number, customer_id e day, ogni combinazione univoca di
questi valori di dimensione rappresenta un segmento. Nella tabella seguente, ogni riga
rappresenta un segmento diverso:
store_number |
customer_id |
day |
| negozio 1 | ||
| negozio 1 | cliente 1 | |
| negozio 1 | cliente 1 | Lunedì |
| negozio 1 | cliente 1 | Martedì |
| negozio 1 | cliente 2 | |
| negozio 2 |
Analizzare i dati senza un modello
Se hai meno di 12 dimensioni e utilizzi una metrica sommabile, puoi eseguire l'analisi del contributo utilizzando la
AI.KEY_DRIVERS TVF.
Per la maggior parte delle applicazioni, consigliamo di utilizzare la funzione AI.KEY_DRIVERS
anziché creare un modello, perché offre una sintassi semplificata, risultati più rapidi e potatura automatica. L'output della funzione
è costituito da righe di approfondimenti, in cui ogni approfondimento corrisponde a un segmento e
fornisce le metriche corrispondenti del segmento.
Utilizzare un modello di analisi del contributo
Per analisi ripetute o se hai bisogno di più di 12 dimensioni o di altri tipi di metriche, puoi creare un modello di analisi del contributo con l'istruzione CREATE MODEL.
Per ridurre il tempo di creazione del modello, specifica una soglia di supporto a priori. Una soglia di supporto a priori consente di eliminare i segmenti piccoli e meno pertinenti in modo che il modello utilizzi solo i segmenti più grandi e pertinenti.
Dopo aver creato un modello di analisi di contributo, puoi utilizzare la
funzione ML.GET_INSIGHTS
per recuperare le informazioni sulla metrica calcolate dal modello. L'output della funzione
è costituito da righe di approfondimenti, in cui ogni approfondimento corrisponde a un segmento e
fornisce le metriche corrispondenti del segmento.
Percorso dell'utente dell'analisi del contributo
La tabella seguente descrive le istruzioni e le funzioni che puoi utilizzare con l'analisi del contributo:
| Istruzione o funzione | Pre-elaborazione delle funzionalità | Generazione di insight | Tutorial |
|---|---|---|---|
AI.KEY_DRIVERS |
Pre-elaborazione manuale | N/D | Esempio di analisi del contributo sui dati di vendita di alcolici in Iowa |
CREATE MODEL |
Pre-elaborazione manuale | ML.GET_INSIGHTS |
Passaggi successivi
- Crea un modello di analisi del contributo
- Ottieni insight sui dati da un modello di analisi di contributo