Ringkasan deteksi anomali
Deteksi anomali adalah teknik penambangan data yang dapat Anda gunakan untuk mengidentifikasi penyimpangan data dalam set data tertentu. Misalnya, jika rasio pengembalian barang untuk produk tertentu meningkat secara substansial dari dasar pengukuran untuk produk tersebut, hal itu mungkin menunjukkan kerusakan produk atau potensi penipuan. Anda dapat menggunakan deteksi anomali untuk mendeteksi insiden penting, seperti masalah teknis, atau peluang, seperti perubahan perilaku konsumen.
Menentukan apa yang dianggap sebagai data anomali bisa jadi sulit. Jika Anda tidak yakin dengan data yang dianggap anomali, atau tidak memiliki data berlabel untuk melatih model, Anda dapat menggunakan unsupervised machine learning untuk melakukan deteksi anomali. Gunakan
fungsi AI.DETECT_ANOMALIES
atau
fungsi ML.DETECT_ANOMALIES
dengan salah satu model berikut untuk mendeteksi anomali dalam data pelatihan atau data penayangan baru:
| Jenis data | Jenis model | Fungsi | Yang dilakukan fungsi |
|---|---|---|---|
| Deret waktu | TimesFM
|
AI.DETECT_ANOMALIES |
Mendeteksi anomali dalam deret waktu. |
ARIMA_PLUS
|
ML.DETECT_ANOMALIES |
Mendeteksi anomali dalam deret waktu. | |
ARIMA_PLUS_XREG
|
ML.DETECT_ANOMALIES |
Mendeteksi anomali dalam deret waktu dengan regressor eksternal. | |
| Variabel acak terdistribusi secara terdistribusi dan identik (IID) | K-means | ML.DETECT_ANOMALIES |
Mendeteksi anomali berdasarkan jarak terpendek di antara jarak
yang dinormalisasi dari data input ke setiap sentroid cluster. Untuk definisi
jarak yang dinormalisasi, lihat output model k-means untuk fungsi ML.DETECT_ANOMALIES. |
| Autoencoder | Mendeteksi anomali berdasarkan kerugian rekonstruksi dalam hal rataan
kuadrat galat. Untuk informasi selengkapnya, lihat ML.RECONSTRUCTION_LOSS. Fungsi ML.RECONSTRUCTION_LOSS dapat
mengambil semua jenis kehilangan rekonstruksi. |
||
| PCA | Mendeteksi anomali berdasarkan kerugian rekonstruksi dalam hal rataan kuadrat galat. |
Jika sudah memiliki data berlabel yang mengidentifikasi anomali, Anda dapat
melakukan deteksi anomali menggunakan
fungsi ML.PREDICT
dengan salah satu model machine learning terawasi berikut:
- Model regresi linear dan logistik
- Model pohon yang ditingkatkan
- Model hutan acak
- Model jaringan neural dalam (DNN)
- Model Wide & Deep
- Model AutoML
Pengetahuan yang direkomendasikan
Dengan menggunakan setelan default dalam pernyataan CREATE MODEL dan fungsi inferensi, Anda dapat membuat dan menggunakan model deteksi anomali meskipun tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang pengembangan ML membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan pemahaman tentang teknik dan proses ML: