文本分类算法的比较研究

ym66828 43 0 PDF 2019-07-15 02:07:05

本文通过对Bayes、KNN、SVM应用于中文文本分类进行比较实验研究。应用ICTCLAS对中文文档进行分词,在大维数,多数据情况下应用TFIDF进行特征选择,并同时利用它实现了对特征项进行加权处理,使文本库中的每个文本具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行训练和分类。

用户评论
请输入评论内容
评分:
暂无评论