Visão geral da detecção de anomalias
A detecção de anomalias é uma técnica de mineração de dados que pode ser usada para identificar desvios nos dados em um determinado conjunto de dados. Por exemplo, se a taxa de devolução de um determinado produto aumentar substancialmente em relação ao valor de referência, isso pode indicar um defeito no produto ou uma possível fraude. Use a detecção de anomalias para detectar incidentes críticos, como problemas técnicos ou oportunidades, como alterações no comportamento do consumidor.
Pode ser difícil determinar o que conta como dados anômalos. Se você não tiver certeza do que conta como dados anômalos ou não tiver dados rotulados para treinar um modelo, use o machine learning sem supervisão para realizar a detecção de anomalias. Use a
função AI.DETECT_ANOMALIES
ou
ML.DETECT_ANOMALIES
com um dos seguintes modelos para detectar anomalias nos dados de treinamento ou nos novos dados de exibição:
| Tipo de dado | Tipos de modelos | Função | O que a função faz |
|---|---|---|---|
| Série temporal | TimesFM
|
AI.DETECT_ANOMALIES |
Detecte as anomalias na série temporal. |
ARIMA_PLUS
|
ML.DETECT_ANOMALIES |
Detecte as anomalias na série temporal. | |
ARIMA_PLUS_XREG
|
ML.DETECT_ANOMALIES |
Detectar as anomalias na série temporal com regressores externos. | |
| Variáveis aleatórias independentes e distribuídas de maneira idêntica | K-means | ML.DETECT_ANOMALIES |
Detecte anomalias com base na menor distância entre as distâncias normalizadas dos dados de entrada para cada centroide do cluster. Para uma definição de distâncias normalizadas, consulte a saída do modelo k-means para a função ML.DETECT_ANOMALIES. |
| Codificador automático | Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio. Veja mais informações em ML.RECONSTRUCTION_LOSS. A função ML.RECONSTRUCTION_LOSS pode recuperar todos os tipos de perda de reconstrução. |
||
| PCA | Detecte anomalias com base na perda de reconstruções em termos de erro quadrático médio. |
Se você já tiver dados rotulados que identificam anomalias, poderá realizar a detecção de anomalias usando a função ML.PREDICT com um dos seguintes modelos de machine learning supervisionado:
- Modelos de regressão linear e logística
- Modelos de árvores aprimoradas
- Modelos de floresta aleatória
- Modelos de rede neural profunda (DNN)
- Modelos de amplitude e profundidade
- Modelos de AutoML
Conhecimento recomendado
Ao usar as configurações padrão nas instruções CREATE MODEL e nas funções de inferência, é possível criar e usar um modelo de detecção de anomalias mesmo sem muito conhecimento de ML. No entanto, ter conhecimentos básicos sobre o desenvolvimento de ML ajuda a otimizar seus dados e seu modelo para gerar resultados melhores. Recomendamos usar os seguintes recursos para se familiarizar com técnicas e processos de ML:
- Curso intensivo de machine learning
- Introdução ao machine learning
- Aprendizado de máquina intermediário