Anomalieerkennung – Übersicht
Die Anomalieerkennung ist ein Data-Mining-Verfahren, mit dem Sie Datenabweichungen in einem bestimmten Datensatz ermitteln können. Wenn sich die Rücksenderate für ein bestimmtes Produkt beispielsweise deutlich über dem Normalwert für dieses Produkt erhöht, kann das auf einen Produktfehler oder potenziellen Betrug hinweisen. Mithilfe der Anomalieerkennung können Sie kritische Vorfälle wie technische Probleme oder Chancen wie Änderungen des Verbraucherverhaltens erkennen.
Es kann schwierig sein, zu bestimmen, was als anormale Daten gilt. Wenn Sie sich nicht sicher sind, was als anormale Daten gilt, oder keine mit Labels versehenen Daten zum Trainieren eines Modells haben, können Sie die Anomalieerkennung mit unbeaufsichtigtem maschinellem Lernen durchführen. Verwenden Sie die AI.DETECT_ANOMALIES-Funktion oder die ML.DETECT_ANOMALIES-Funktion mit einem der folgenden Modelle, um Anomalien in Trainingsdaten oder neuen Auslieferungsdaten zu erkennen:
| Datentyp | Modelltypen | Funktion | Was die Funktion tut |
|---|---|---|---|
| Zeitreihe | TimesFM
|
AI.DETECT_ANOMALIES |
Anomalien in der Zeitreihe erkennen. |
ARIMA_PLUS
|
ML.DETECT_ANOMALIES |
Anomalien in der Zeitreihe erkennen. | |
ARIMA_PLUS_XREG
|
ML.DETECT_ANOMALIES |
Anomalien in der Zeitreihe mit externen Regressoren erkennen. | |
| Unabhängige und identisch verteilte Zufallsvariablen (IID) | K-means | ML.DETECT_ANOMALIES |
Anomalien auf der Grundlage der kürzesten Entfernung bei den normalisierten Entfernungen von den Eingabedaten zu jedem Clusterschwerpunkt erkennen. Eine Definition der normalisierten Entfernungen finden Sie in der K-Means-Modellausgabe für die Funktion ML.DETECT_ANOMALIES. |
| Autoencoder | Anomalien aufgrund des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen. Weitere Informationen finden Sie unter ML.RECONSTRUCTION_LOSS. Die Funktion ML.RECONSTRUCTION_LOSS kann
alle Arten von Rekonstruktionsverlusten abrufen. |
||
| PCA | Anomalien anhand des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen. |
Wenn Sie bereits Daten mit Labels haben, anhand derer Anomalien identifiziert werden, können Sie die Anomalieerkennung mit der Funktion ML.PREDICT und einem der folgenden beaufsichtigten Modelle für maschinelles Lernen durchführen:
- Lineare und logistische Regressionsmodelle
- Boosted Tree-Modelle
- Random Forest-Modelle
- Modelle mit neuronalem Deep-Learning-Netzwerk (DNN)
- Wide & Deep-Modelle
- AutoML-Modelle
Empfohlenes Wissen
Wenn Sie die Standardeinstellungen in den CREATE MODEL-Anweisungen und den Inferenzfunktionen verwenden, können Sie ein Modell zur Anomalieerkennung auch ohne viel ML-Wissen erstellen und verwenden. Grundlegende Kenntnisse über die ML-Entwicklung helfen Ihnen jedoch, sowohl Ihre Daten als auch Ihr Modell zu optimieren, um bessere Ergebnisse zu erzielen. Wir empfehlen die folgenden Ressourcen, um sich mit ML-Techniken und -Prozessen vertraut zu machen:
- Crashkurs zum maschinellen Lernen
- Einführung in das maschinelle Lernen
- Intermediate Machine Learning