本文基于密度的概念,对每个点(文本)按密度大小排序,通过自适应选择最佳密度半径来确定最大的点密度,选择密度较大且合理的点作为聚类的初始中心店,从而优化中心点的选择,使k-means算法有个好的起点。