不平衡数据的距离加权分类算法的误差分析 摘 要 近年来随着科技和信息技术的发展高维小样本问题和不平衡数据问题越来越 受研究者的重视支持向量机算法是最流行的分类算法之一由于其分类边界的确定 只依赖于部分被称之为支持向量的训练样本这导致其在处理高维小样本数据时产生 了数据堆积现象从而影响了其分类效果距离加权分类算法旨在解决支持向量 机在处理高维小样本数据时所固有的数据堆积现象但该算法并不能很好地处理