Visão geral da detecção de anomalias

A detecção de anomalias é uma técnica de mineração de dados que pode ser usada para identificar desvios nos dados em um determinado conjunto de dados. Por exemplo, se a taxa de devolução de um determinado produto aumentar substancialmente em relação ao valor de referência, isso pode indicar um defeito no produto ou uma possível fraude. Use a detecção de anomalias para detectar incidentes críticos, como problemas técnicos ou oportunidades, como alterações no comportamento do consumidor.

Pode ser difícil determinar o que conta como dados anômalos. Se você não tiver certeza do que conta como dados anômalos ou não tiver dados rotulados para treinar um modelo, use o machine learning sem supervisão para realizar a detecção de anomalias. Use a função AI.DETECT_ANOMALIES ou ML.DETECT_ANOMALIES com um dos seguintes modelos para detectar anomalias nos dados de treinamento ou nos novos dados de exibição:

Tipo de dado Tipos de modelos Função O que a função faz
Série temporal TimesFM AI.DETECT_ANOMALIES Detecte as anomalias na série temporal.
ARIMA_PLUS ML.DETECT_ANOMALIES Detecte as anomalias na série temporal.
ARIMA_PLUS_XREG ML.DETECT_ANOMALIES Detectar as anomalias na série temporal com regressores externos.
Variáveis aleatórias independentes e distribuídas de maneira idêntica K-means ML.DETECT_ANOMALIES Detecte anomalias com base na menor distância entre as distâncias normalizadas dos dados de entrada para cada centroide do cluster. Para uma definição de distâncias normalizadas, consulte a saída do modelo k-means para a função ML.DETECT_ANOMALIES.
Codificador automático Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio. Veja mais informações em ML.RECONSTRUCTION_LOSS. A função ML.RECONSTRUCTION_LOSS pode recuperar todos os tipos de perda de reconstrução.
PCA Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio.

Se você já tiver dados rotulados que identificam anomalias, poderá realizar a detecção de anomalias usando a função ML.PREDICT com um dos seguintes modelos de machine learning supervisionado:

Ao usar as configurações padrão nas instruções CREATE MODEL e nas funções de inferência, é possível criar e usar um modelo de detecção de anomalias mesmo sem muito conhecimento de ML. No entanto, ter conhecimentos básicos sobre o desenvolvimento de ML ajuda a otimizar seus dados e seu modelo para gerar resultados melhores. Recomendamos usar os seguintes recursos para se familiarizar com técnicas e processos de ML: