论文研究不均衡数据集文本分类中少数类样本生成方法研究.pdf

CSDN阿坤 20 0 PDF 2020-03-16 07:03:24

针对传统的分类算法在处理不均衡样本数据时,其分类器预测倾向于多数类,少数类分类误差大,提出了一种基于聚类和遗传算法的样本生成方法。先通过K-means算法将少数类样本聚类分组;再在每个聚类的内部使用遗传交叉和变异操作获取新样本,并进行有效性验证;最后使用原始数据集和新数据集分别训练K最近邻(Knearestneighbor,KNN)及支持向量机(supportvectormachine,SVM)分类器。实验结果表明此方法有效改善了少数类分类效果。

用户评论
请输入评论内容
评分:
暂无评论