概述 KMEANS算法又被成为K均值算法是一种常用的聚类算法由于不需要根据给定的训练集训练模型因此是一种无监督学习算法其本质是根据选定的参数K将数据分类成K类在聚类过程中从单一样本开始通过不断计算聚类数据的均值来作为整个类的中心进而再将距离此类别中心最近的数据纳入同一类 算法原理 1以下图样本散点图展示数据集的整体分布情况 2K值是KMEANS最重要的选择参数直接决定着数据聚类的类别数量在选择K值