Panoramica del rilevamento di anomalie

Il rilevamento di anomalie è una tecnica di data mining che puoi utilizzare per identificare deviazioni dei dati in un determinato set di dati. Ad esempio, se il tasso di reso per un determinato prodotto aumenta notevolmente rispetto alla linea di base per quel prodotto, ciò potrebbe indicare un difetto del prodotto o una potenziale frode. Puoi utilizzare il rilevamento delle anomalie per rilevare incidenti critici, ad esempio problemi tecnici, o opportunità, ad esempio cambiamenti nel comportamento dei consumatori.

Può essere difficile determinare cosa viene considerato dato anomalo. Se non sai con certezza cosa conta come dati anomali o non disponi di dati etichettati per addestrare un modello, puoi utilizzare il machine learning non supervisionato per eseguire il rilevamento delle anomalie. Utilizza la funzione AI.DETECT_ANOMALIES o la funzione ML.DETECT_ANOMALIES con uno dei seguenti modelli per rilevare anomalie nei dati di addestramento o nei nuovi dati di servizio:

Tipo di dati Tipi di modello Funzione Cosa fa la funzione
Serie temporale TimesFM AI.DETECT_ANOMALIES Rileva le anomalie nella serie temporale.
ARIMA_PLUS ML.DETECT_ANOMALIES Rileva le anomalie nella serie temporale.
ARIMA_PLUS_XREG ML.DETECT_ANOMALIES Rileva le anomalie nella serie temporale con i regressori esterni.
Variabili casuali indipendenti e identicamente distribuite (IID) K-means ML.DETECT_ANOMALIES Rileva le anomalie in base alla distanza più breve tra le distanze normalizzate dai dati di input a ogni centroide del cluster. Per una definizione di distanze normalizzate, consulta l'output del modello k-means per la funzione ML.DETECT_ANOMALIES.
Autoencoder Rileva le anomalie in base alla perdita di ricostruzione in termini di errore quadratico medio. Per ulteriori informazioni, vedi ML.RECONSTRUCTION_LOSS. La funzione ML.RECONSTRUCTION_LOSS può recuperare tutti i tipi di perdita di ricostruzione.
PCA Rileva le anomalie in base alla perdita di ricostruzione in termini di errore quadratico medio.

Se disponi già di dati etichettati che identificano le anomalie, puoi eseguire il rilevamento delle anomalie utilizzando la funzione ML.PREDICT con uno dei seguenti modelli di machine learning supervisionato:

Utilizzando le impostazioni predefinite nelle istruzioni CREATE MODEL e nelle funzioni di inferenza, puoi creare e utilizzare un modello di rilevamento delle anomalie anche senza molte conoscenze di ML. Tuttavia, avere una conoscenza di base dello sviluppo di ML ti aiuta a ottimizzare sia i dati sia il modello per ottenere risultati migliori. Ti consigliamo di utilizzare le seguenti risorse per acquisire familiarità con le tecniche e i processi di ML: