基于CHI值特征选取和覆盖的文本分类方法
利用CHI值特征选取和前向神经网络的覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类。该方法利用CHI值进行特征选取即特征降维,应用覆盖算法进行文本分类。该方法将CHI值特征选取和覆盖算法充分结合,在提高了分类速度的同时还保证了分类的准确度。应用该方法对标准数据集中的文本进行实验,并在不同的维数上与SVM算法、朴素贝叶斯方法的实验结果进行了比较。结果表明,与SVM算法和朴素贝叶斯方法相比较,覆盖算法在准确度上更好。并且,维数的选择对分类的精确度影响很大。
推荐下载
-
文本分类算法分析一种很好的文本分类算法
一种很好的分类算法,字数还得大于20,你爷爷的。好东西就是好东西。
43 2019-05-06 -
高性能特征选择及文本分类算法研究
本文针对现有特征选择算法没有利用有用的词条频率信息。没有定性分析的现状,提出了基于词条频率的改进特征选择算法,对特征选择算法进行了定性分,提出了构造高效特征选择方法的约束条件和步骤,构造出一种高效的特
54 2018-12-15 -
文本分类综述各种方法介绍
K一近邻法是一种传统的基于统计的模式识别方法,其算法思想也很简单:给定一个待分类的测试文档,系统在训练集中查找最相似的k个文档(称为邻居),并根据这些邻居的类别所属情况来给该文档的候选类别评分。可以把
28 2018-12-26 -
基于Web文本挖掘的SVM网页文本分类研究
互联网web网页,利用SVM技术实现对web进行挖掘、检索等,本文采用这种方法以处理海量数据,网页自动分类,通过自动分类建立数据库,提高搜索引擎的查全率和查准率,而且可以自动的分类信息资源,为用户提供
33 2018-12-20 -
最大熵的文本分类
最大熵模型用于文本分类的例子,里面有数据集和Python代码
16 2019-07-06 -
分本分类特征抽取
中文文本分类中特征抽取方法的比较研究:计算机应用;中文信息处理;文本自动分类;特征抽取;支持向量机;
24 2019-06-04 -
基于质心的半监督文本分类算法
文本分类算法的基础描述,基于质心的半监督文本分类算法的具体描述,
14 2020-09-27 -
基于搜索的短文本分类算法研究
针对传统分类算法在处理短文本时的不足,提出了一种基于搜索的NaiveBayes文本分类方法。该分类方法对文本数据集规模、文档长度、类别数量、分布等情况综合考虑,对朴素贝叶斯算法进行改进,将搜索技术应用
12 2020-10-28 -
基于深度学习的文本分类研究.pdf
从文本分类由美国学者H.P.Luhn教授在1957年第一次被提出来,现今文本分类已经成为数据挖掘领域非常重要的~个分支,它已经在搜索引擎等领域有较好的应用.文本分类中特征选择是降低特征空间维数提高分
10 2020-05-04 -
基于卷积递归模型的文本分类研究
近年来卷积神经网络和循环神经网络在文本分类领域得到了越来越广泛的的应用。提出一种卷积神经网络和长短时记忆网络特征融合的模型,通过长短期记忆网络作为池化层的替代来获得长期依赖性,从而构建一个联合CNN和
10 2020-11-06
用户评论