k-means算法是一种基于样本间相似性度量的间接聚类方法。此算法以k为参数,把n 个对象分为k个簇,以使簇内具有较高的相似度,而且簇间的相似度较低。相似度的计算根据一个簇中对象的平均值来进行。此算法首先随机选择k个对象,每个对象代表一个聚类中心。对于其余的每一个对象,根据该对象与各聚类中心之间的距离,把它分配到与之最相似的聚类中。然后,计算每个聚类的新中心。重复上述过程,直到准则函数收敛。