K最近邻(kNN,k-NearestNeighbor)分类算法,即k个最近的邻居,说的是每个样本都可以用它最接近的k个邻居来代表。 KNN是通过测量不同特征值之间的距离进行分类。 算法思路是:如果一个样本在特征空间中的k个最邻近的样本中的大多数属于某一个类别,则该样本也划分为这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 算法伪代码: 1)计算测试数据与各个训练数据之间的距离; 2)按照距离的递增关系进行排序; 3)选取距离最小的K个点; 4)确定前K个点所在类别的出现频率;