聚簇概览

聚簇是一种非监督式机器学习技术,可用于将相似的记录分组。如果您想了解数据中包含哪些群组或集群,但没有带标签的数据来训练模型,那么这种方法非常有用。例如,如果您有关于地铁票购买情况的未标记数据,则可以按购票时间对这些数据进行聚簇,以便更好地了解哪些时间段的地铁使用量最大。如需了解详情,请参阅什么是聚簇?

K-means 模型广泛用于执行聚簇。您可以将 k-means 模型与 ML.PREDICT 函数搭配使用来聚簇数据,也可以与 ML.DETECT_ANOMALIES 函数搭配使用来执行异常值检测

K-means 模型使用基于形心的聚簇将数据整理到各个集群中。如需获取有关 k-means 模型形心的信息,您可以使用 ML.CENTROIDS 函数

通过使用 CREATE MODEL 语句和推理函数中的默认设置,即使您没有太多机器学习知识,也可以创建和使用聚簇模型。不过,如果您具备机器学习开发(尤其是聚簇模型)的基本知识,则有助于您优化数据和模型,从而获得更好的结果。我们建议您使用以下资源来熟悉机器学习技术和流程: