Ringkasan pengelompokan
Pengelompokan adalah teknik unsupervised machine learning yang dapat Anda gunakan untuk mengelompokkan catatan serupa. Pendekatan ini berguna saat Anda ingin memahami grup atau cluster yang ada dalam data, tetapi tidak memiliki data berlabel untuk melatih model. Misalnya, jika Anda memiliki data yang tidak berlabel tentang pembelian tiket kereta bawah tanah, Anda dapat mengelompokkan data tersebut berdasarkan waktu pembelian tiket untuk lebih memahami periode waktu dengan penggunaan kereta bawah tanah paling padat. Untuk mengetahui informasi selengkapnya, lihat Apa itu pengelompokan?
Model k-means
banyak digunakan untuk melakukan pengelompokan. Anda dapat menggunakan model k-means dengan
fungsi ML.PREDICT
untuk mengelompokkan data, atau dengan
fungsi ML.DETECT_ANOMALIES
untuk melakukan deteksi anomali.
Model k-means menggunakan
pengelompokan berbasis sentroid untuk mengatur data ke dalam cluster.
Untuk mendapatkan informasi tentang sentroid model k-means, Anda dapat menggunakan
fungsi ML.CENTROIDS.
Informasi yang direkomendasikan
Dengan menggunakan setelan default dalam pernyataan CREATE MODEL dan fungsi inferensi, Anda dapat membuat dan menggunakan model pengelompokan meskipun tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang pengembangan ML, dan model clustering khususnya, akan membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan pemahaman tentang teknik dan proses ML:
- Kursus Singkat Machine Learning
- Pengantar Machine Learning
- Intermediate Machine Learning
- Pengelompokan