Descripción general del agrupamiento en clústeres
El agrupamiento en clústeres es una técnica de aprendizaje automático no supervisado que puedes usar para agrupar registros similares. Es un enfoque útil cuando deseas comprender qué grupos o clústeres tienes en tus datos, pero no tienes datos etiquetados para entrenar un modelo. Por ejemplo, si tuvieras datos sin etiquetar sobre las compras de boletos de metro, podrías agrupar esos datos por hora de compra para comprender mejor qué períodos tienen el mayor uso del metro. Para obtener más información, consulta ¿Qué es el clustering?
Los modelos de k-means se usan ampliamente para realizar el agrupamiento en clústeres. Puedes usar modelos de k-means con la función ML.PREDICT para agrupar datos en clústeres o con la función ML.DETECT_ANOMALIES para realizar la detección de anomalías.
Los modelos de K-means usan el agrupamiento basado en centroides para organizar los datos en clústeres.
Para obtener información sobre los centroides de un modelo k-means, puedes usar la función ML.CENTROIDS.
Conocimientos recomendados
Si usas la configuración predeterminada en las instrucciones CREATE MODEL y las funciones de inferencia, puedes crear y usar un modelo de clustering incluso sin tener muchos conocimientos de AA. Sin embargo, tener conocimientos básicos sobre el desarrollo de AA y los modelos de agrupamiento en particular te ayuda a optimizar tanto tus datos como tu modelo para ofrecer mejores resultados. Te recomendamos que uses los siguientes recursos para familiarizarte con las técnicas y los procesos de AA:
- Curso intensivo de aprendizaje automático
- Introducción al aprendizaje automático
- Intermediate Machine Learning
- Agrupamiento en clústeres