Panoramica del rilevamento di anomalie
Il rilevamento di anomalie è una tecnica di data mining che puoi utilizzare per identificare deviazioni dei dati in un determinato set di dati. Ad esempio, se il tasso di reso per un determinato prodotto aumenta notevolmente rispetto alla linea di base per quel prodotto, ciò potrebbe indicare un difetto del prodotto o una potenziale frode. Puoi utilizzare il rilevamento delle anomalie per rilevare incidenti critici, ad esempio problemi tecnici, o opportunità, ad esempio cambiamenti nel comportamento dei consumatori.
Può essere difficile determinare cosa viene considerato dato anomalo. Se non sai
con certezza cosa conta come dati anomali o non disponi di dati
etichettati per addestrare un modello, puoi utilizzare il machine learning non supervisionato per eseguire
il rilevamento delle anomalie. Utilizza la
funzione AI.DETECT_ANOMALIES
o la
funzione ML.DETECT_ANOMALIES
con uno dei seguenti modelli per rilevare anomalie nei dati di addestramento o nei nuovi
dati di servizio:
| Tipo di dati | Tipi di modello | Funzione | Cosa fa la funzione |
|---|---|---|---|
| Serie temporale | TimesFM
|
AI.DETECT_ANOMALIES |
Rileva le anomalie nella serie temporale. |
ARIMA_PLUS
|
ML.DETECT_ANOMALIES |
Rileva le anomalie nella serie temporale. | |
ARIMA_PLUS_XREG
|
ML.DETECT_ANOMALIES |
Rileva le anomalie nella serie temporale con i regressori esterni. | |
| Variabili casuali indipendenti e identicamente distribuite (IID) | K-means | ML.DETECT_ANOMALIES |
Rileva le anomalie in base alla distanza più breve tra le distanze normalizzate
dai dati di input a ogni centroide del cluster. Per una definizione di distanze normalizzate, consulta l'output del modello k-means per la funzione ML.DETECT_ANOMALIES. |
| Autoencoder | Rileva le anomalie in base alla perdita di ricostruzione in termini di errore
quadratico medio. Per ulteriori informazioni, vedi ML.RECONSTRUCTION_LOSS. La funzione ML.RECONSTRUCTION_LOSS può
recuperare tutti i tipi di perdita di ricostruzione. |
||
| PCA | Rileva le anomalie in base alla perdita di ricostruzione in termini di errore quadratico medio. |
Se disponi già di dati etichettati che identificano le anomalie, puoi
eseguire il rilevamento delle anomalie utilizzando la
funzione ML.PREDICT
con uno dei seguenti modelli di machine learning supervisionato:
- Modelli di regressione lineare e logistica
- Modelli boosted tree
- Modelli di foresta casuale
- Modelli basati su rete neurale profonda (DNN)
- Modelli Wide and Deep
- Modelli AutoML
Conoscenze consigliate
Utilizzando le impostazioni predefinite nelle istruzioni CREATE MODEL e nelle
funzioni di inferenza, puoi creare e utilizzare un modello di rilevamento delle anomalie
anche senza molte conoscenze di ML. Tuttavia, avere una conoscenza di base dello sviluppo di ML ti aiuta a ottimizzare sia i dati sia il modello per ottenere risultati migliori. Ti consigliamo di utilizzare le seguenti risorse per acquisire familiarità con le tecniche e i processi di ML: