非平衡数据特征问题的研究与非平衡分类问题算法综述. 数据集合的非平衡性指不同类型的样本量的大小较为悬殊。近年来,肖衡 数据分类问题的重要性已经引起了广泛关注。然而,对于高维非平衡数据分类特 征选择技术的研究并不多见。本文在回顾了非平衡数据已有方法的同时,介绍了 两种新的应对方法,分别是基于类型分解的特征选择方法,以及基于Hellinger 距离的特征
Java将文本文件写成csv格式文件 为了实现R语言文本挖掘,所需的csv格式文件,利用Java 将文本文件写成csv格式的文件;文本文件的存放结构为---example ---class1 t1.txt ... ---class2 f1.txt ...