这个算法的基础是误差平方和准则,为了要得到最优结果,首先要对样本集进行划分,一般的做法是先选择一些代表性的点作为聚类的核心,然后把其余的点按照某种方法分到各类中去。