KNN算法 一、概念 KNN(K Near Neighbor):k个最近的邻居,即每个样本都可以用它最接近的k个邻居来代表。 用我们的一句古语来说就是:物以类聚,人以群分。假如一个人的通讯录里有马云、王健林、李嘉诚等,那么这个人肯定也是这个圈子里的人;再假如,一个爱好游戏的人的朋友圈,应该大部分都是玩游戏的;爱喝酒的人的朋友圈,应该都是爱喝酒的;有句话说得好,臭味相投。 最近邻算法是一种分类算法,1968年由Cover和Hart提出,应用场景有字符识别、文本分类、图像识别等领域。 该算法的思想是:一个样本与数据集中的k个样本最相似,如果这k个样本中的大多数属于某一个类别,则该样本也属于这个类别