基于Python——Kmeans聚类算法的实现
1、概述 本篇博文为数据挖掘算法系列的第一篇。现在对于Kmeans算法进行简单的介绍,Kmeans算法是属于无监督的学习的算法,并且是最基本、最简单的一种基于距离的聚类算法。 下面简单说一下Kmeans算法的步骤: 选随机选取K的簇中心(注意这个K是自己选择的) 计算每个数据点离这K个簇中心的距离,然后将这个点划分到距离最小的簇中 重新计算簇中心,即将每个簇的所有数据点相加求均值,将这个均值作为对应簇的新簇中心。 重复2、3步,直到满足了你设置的停止算法迭代的条件 注意:停止算法迭代的条件一般有三个: 没有(或最小数目)对象被重新分配给不同的聚类。 没有(或最小数目)聚类中心再发生变化。 误差
暂无评论