K-means 算法介绍和 K 值探讨 用Python 玩转数据 by 大壮@NJU K-means 算法是典型的基于距离的聚类算法采用距离作为相似性的评价指标两 个对象的距离越近其相似度就越大而簇是由距离靠近的对象组成的因此算法目的是 得到紧凑并且独立的簇 假设要将对象分成k 个簇算法过程如下 (1) 随机选取任意k 个对象作为初始聚类的中心 质心Centroid初始代表每一个 簇 (2) 对