? 该算法在分类时有个主要的不足是当样本不平衡时 如一个类的样本容量很大而其他类样本容量很小时 有可能导致当输入一个新样本时该样本的K个邻居中 大容量类的样本占多数 ? 改进 ? 分组快速搜索近邻法 ? 其基本思想是将样本集按近邻关系分解成组给出每组质心的位 置以质心作为代表点和未知样本计算距离选出距离最近的一 个或若干个组再在组的范围内应用一般的knn算法由于并不是 将未知样本与所有样本计算距