Panoramica di BigQuery Explainable AI
Questo documento descrive in che modo BigQuery ML supporta l'intelligenza artificiale (AI) spiegabile, a volte chiamata XAI.
Explainable AI ti aiuta a comprendere i risultati generati dal modello di machine learning predittivo per le attività di classificazione e regressione definendo il contributo di ogni caratteristica in una riga di dati al risultato previsto. Queste informazioni vengono spesso chiamate attribuzione delle caratteristiche. Puoi utilizzare queste informazioni per verificare se il modello funziona come previsto, riconoscere i bias nei modelli e trovare idee per migliorare il modello e i dati di addestramento.
BigQuery ML e Gemini Enterprise Agent Platform offrono entrambi Explainable AI, che fornisce spiegazioni basate sulle caratteristiche. Puoi eseguire la spiegabilità in BigQuery ML oppure puoi registrare il modello in Agent Platform ed eseguirla lì.
Spiegabilità locale e globale
Esistono due tipi di spiegabilità: locale e globale. Questi sono noti rispettivamente anche come importanza delle caratteristiche locali e importanza delle caratteristiche globali.
- La spiegabilità locale restituisce i valori di attribuzione delle caratteristiche per ogni esempio spiegato. Questi valori descrivono in che misura una determinata caratteristica ha influito sulla previsione rispetto alla previsione di base.
- La spiegabilità globale restituisce l'influenza complessiva della caratteristica sul modello e viene spesso ottenuta aggregando le attribuzioni delle caratteristiche sull'intero set di dati. Un valore assoluto più alto indica che la caratteristica ha avuto una maggiore influenza sulle previsioni del modello.
Offerte di Explainable AI in BigQuery ML
Explainable AI in BigQuery ML supporta una varietà di modelli di machine learning, inclusi i modelli di serie temporali e non di serie temporali. Ciascuno dei modelli sfrutta un metodo di spiegabilità diverso.
| Categoria di modello | Tipi di modello | Metodo di spiegabilità | Spiegazione di base del metodo | Funzioni di spiegazione locali | Funzioni di spiegazione globali |
|---|---|---|---|---|---|
| Modelli supervisionati | Regressione lineare e logistica | Valori di Shapley | I valori di Shapley per i modelli lineari sono uguali a model weight * feature
value, dove i valori delle caratteristiche sono standardizzati e i pesi del modello vengono
addestrati con i valori delle caratteristiche standardizzati. |
ML.EXPLAIN_PREDICT1 |
ML.GLOBAL_EXPLAIN2 |
| Errori standard e valori p | Gli errori standard e i valori p vengono utilizzati per il test di significatività rispetto ai pesi del modello. | N/D | ML.ADVANCED_WEIGHTS4 |
||
| Modelli boosted tree Foresta casuale |
Tree SHAP | Tree SHAP è un algoritmo per calcolare i valori SHAP esatti per i modelli basati su alberi decisionali. | ML.EXPLAIN_PREDICT1 |
ML.GLOBAL_EXPLAIN2 |
|
| Contributo approssimativo delle caratteristiche | Approssima i valori del contributo delle caratteristiche. È più veloce e semplice rispetto a Tree SHAP. | ML.EXPLAIN_PREDICT1 |
ML.GLOBAL_EXPLAIN2 |
||
| Importanza delle caratteristiche basata sull'indice di Gini | Un punteggio di importanza delle caratteristiche globale che indica l'utilità o il valore di ogni caratteristica nella costruzione del modello boosted tree o foresta casuale durante l'addestramento. | N/D | ML.FEATURE_IMPORTANCE |
||
| Rete neurale profonda (DNN) Wide-and-Deep |
Gradienti integrati | Un metodo basato sui gradienti che calcola in modo efficiente le attribuzioni delle caratteristiche
con le stesse proprietà assiomatiche del valore di Shapley. Fornisce un'
approssimazione di campionamento delle attribuzioni delle caratteristiche esatte. La sua accuratezza è
controllata dal integrated_gradients_num_steps
parametro. |
ML.EXPLAIN_PREDICT1 |
ML.GLOBAL_EXPLAIN2 |
|
| AutoML Tables | Valore di Shapley campionato | Il valore di Shapley campionato assegna il credito per il risultato del modello a ogni caratteristica, e considera diverse permutazioni delle caratteristiche. Questo metodo fornisce un'approssimazione di campionamento dei valori di Shapley esatti. | N/D | ML.GLOBAL_EXPLAIN2 |
|
| Modelli di serie temporali | ARIMA_PLUS | Decomposizione di serie temporali | Decompone la serie temporale in più componenti se questi sono presenti nella serie temporale. I componenti includono tendenza, stagionalità, festività, variazioni graduali, picchi e cali. Per ulteriori dettagli, consulta la pipeline di modellazione ARIMA_PLUS per ulteriori dettagli. | ML.EXPLAIN_FORECAST3 |
N/D |
| ARIMA_PLUS_XREG | Decomposizione di serie temporali e Valori di Shapley |
Decompone la serie temporale in più componenti, tra cui tendenza, stagionalità, festività, variazioni graduali, picchi e cali
(simili a ARIMA_PLUS).
L'attribuzione di ogni regressore esterno viene calcolata in base ai
valori di Shapley, che sono uguali a model weight * feature value. |
ML.EXPLAIN_FORECAST3 |
N/D |
1ML_EXPLAIN_PREDICT è una versione estesa di ML.PREDICT.
2ML.GLOBAL_EXPLAIN restituisce la spiegabilità globale
ottenuta prendendo l'attribuzione assoluta media che ogni caratteristica riceve per
tutte le righe nel set di dati di valutazione.
3ML.EXPLAIN_FORECAST è una versione estesa di ML.FORECAST.
4ML.ADVANCED_WEIGHTS è una versione estesa di ML.WEIGHTS.
Explainable AI in Agent Platform
Explainable AI è disponibile in Agent Platform per il seguente sottoinsieme di modelli di apprendimento supervisionato esportabili:
| Tipo di modello | Metodo di Explainable AI |
|---|---|
| dnn_classifier | Gradienti integrati |
| dnn_regressor | Gradienti integrati |
| dnn_linear_combined_classifier | Gradienti integrati |
| dnn_linear_combined_regressor | Gradienti integrati |
| boosted_tree_regressor | Valore di Shapley campionato |
| boosted_tree_classifier | Valore di Shapley campionato |
| random_forest_regressor | Valore di Shapley campionato |
| random_forest_classifier | Valore di Shapley campionato |
Per saperne di più su questi metodi, consulta Metodi di attribuzione delle caratteristiche.
Abilitare l'AI spiegabile in Model Registry
Quando il modello BigQuery ML viene registrato in Model Registry e se è un tipo di modello che supporta l'Explainable AI, puoi abilitare l'Explainable AI sul modello durante il deployment in un endpoint. Quando registri il modello BigQuery ML, tutti i metadati associati vengono compilati automaticamente.
- Registra il modello BigQuery ML in Model Registry.
- Vai alla pagina Model Registry dalla sezione BigQuery della Google Cloud console.
- In Model Registry, seleziona il modello BigQuery ML e fai clic sulla versione del modello per essere reindirizzato alla pagina dei dettagli del modello.
- Seleziona Altre azioni dalla versione del modello.
- Fai clic su Esegui il deployment su endpoint.
- Definisci l'endpoint: crea un nome dell'endpoint e fai clic su Continua.
- Seleziona un tipo di macchina, ad esempio
n1-standard-2. - In Impostazioni modello, nella sezione di logging, seleziona la casella di controllo per abilitare le opzioni di spiegabilità.
- Fai clic su Fine, quindi su Continua per eseguire il deployment nell'endpoint.
Per scoprire come utilizzare XAI sui modelli da Model Registry, consulta Ottenere una spiegazione online utilizzando il modello di cui hai eseguito il deployment.
Passaggi successivi
- Scopri come gestire i modelli BigQuery ML in Gemini Enterprise Agent Platform.
- Per ulteriori informazioni sulle istruzioni e le funzioni SQL supportate per i modelli che supportano la spiegabilità, consulta Percorsi utente end-to-end per i modelli ML.