本文主要参考周志华《机器学习》的9.6章节,对密度聚类做简单介绍,并使用numpy对具有代表性的DBSCAN密度聚类算法进行实现。 1、何为密度聚类? 密度聚类顾名思义是一种基于密度的聚类方法, 此类算法假设聚类结构能通过样本分布的紧密程度确定,通常情形下,密度聚类算法从样本密度的角度来考察样本之间的可连接性,并基于可连接样本不断扩展聚类簇以获得最终的聚类结果。 —-《机器学习》 可能看到上述的解释,大家还无法理解什么是密度聚类。不要着急,看完下面的DBSCAN算法,你就明白了。 2、DBSCAN算法 DBSCAN是其中的一种著名算法。理解DBSCAN算法之前,要理解一个重要概