Anomalieerkennung – Übersicht

Die Anomalieerkennung ist ein Data-Mining-Verfahren, mit dem Sie Datenabweichungen in einem bestimmten Datensatz ermitteln können. Wenn sich die Rücksenderate für ein bestimmtes Produkt beispielsweise deutlich über dem Normalwert für dieses Produkt erhöht, kann das auf einen Produktfehler oder potenziellen Betrug hinweisen. Mithilfe der Anomalieerkennung können Sie kritische Vorfälle wie technische Probleme oder Chancen wie Änderungen des Verbraucherverhaltens erkennen.

Es kann schwierig sein, zu bestimmen, was als anormale Daten gilt. Wenn Sie sich nicht sicher sind, was als anormale Daten gilt, oder keine mit Labels versehenen Daten zum Trainieren eines Modells haben, können Sie die Anomalieerkennung mit unbeaufsichtigtem maschinellem Lernen durchführen. Verwenden Sie die AI.DETECT_ANOMALIES-Funktion oder die ML.DETECT_ANOMALIES-Funktion mit einem der folgenden Modelle, um Anomalien in Trainingsdaten oder neuen Auslieferungsdaten zu erkennen:

Datentyp Modelltypen Funktion Was die Funktion tut
Zeitreihe TimesFM AI.DETECT_ANOMALIES Anomalien in der Zeitreihe erkennen.
ARIMA_PLUS ML.DETECT_ANOMALIES Anomalien in der Zeitreihe erkennen.
ARIMA_PLUS_XREG ML.DETECT_ANOMALIES Anomalien in der Zeitreihe mit externen Regressoren erkennen.
Unabhängige und identisch verteilte Zufallsvariablen (IID) K-means ML.DETECT_ANOMALIES Anomalien auf der Grundlage der kürzesten Entfernung bei den normalisierten Entfernungen von den Eingabedaten zu jedem Clusterschwerpunkt erkennen. Eine Definition der normalisierten Entfernungen finden Sie in der K-Means-Modellausgabe für die Funktion ML.DETECT_ANOMALIES.
Autoencoder Anomalien aufgrund des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen. Weitere Informationen finden Sie unter ML.RECONSTRUCTION_LOSS. Die Funktion ML.RECONSTRUCTION_LOSS kann alle Arten von Rekonstruktionsverlusten abrufen.
PCA Anomalien anhand des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen.

Wenn Sie bereits Daten mit Labels haben, anhand derer Anomalien identifiziert werden, können Sie die Anomalieerkennung mit der Funktion ML.PREDICT und einem der folgenden beaufsichtigten Modelle für maschinelles Lernen durchführen:

Wenn Sie die Standardeinstellungen in den CREATE MODEL-Anweisungen und den Inferenzfunktionen verwenden, können Sie ein Modell zur Anomalieerkennung auch ohne viel ML-Wissen erstellen und verwenden. Grundlegende Kenntnisse über die ML-Entwicklung helfen Ihnen jedoch, sowohl Ihre Daten als auch Ihr Modell zu optimieren, um bessere Ergebnisse zu erzielen. Wir empfehlen die folgenden Ressourcen, um sich mit ML-Techniken und -Prozessen vertraut zu machen: