基于LDA特征扩展的短文本分类_吕超镇

the832 24 0 CAJ 2019-09-23 10:09:08

针对中文短文本篇幅较短、特征稀疏性等特征，提出了一种基于隐含狄利克雷分布模型的特征扩展的短文本分类方法。在短文本原始特征的基础上，利用LDA主题模型对短文本进行预测，得到对应的主题分布，把主题中的词作为短文本的部分特征，并扩充到原短文本的特征中去，最后利用SVM分类方法进行短文本的分类。实验表明，该方法在性能上与传统的直接使用VSM模型来表示短文本特征的方法相比，对不同类别的短文本进行分类，都有不同程度的提高与改进，对于短文本进行补充LDA特征信息的方法是切实可行的。

用户评论

暂无评论

基于类别特征向量表示的中文文本分类算法

基于类别特征向量表示的中文文本分类算法书中介绍了一种新的方法，在不分类的基础上实现分类

30 2019-09-20
论文研究基于发现特征子空间模型的文本分类算法.pdf

在非结构化数据挖掘结构模型，即发现特征子空间模型(DFSSM)的运行机制下，提出了一种新的文本分类算法——基于DFSSM的文本分类(TCDFSSM)算法。该算法在文本训练及分类阶段的基础上增加了自动反

43 2019-09-28
论文研究基于隶属度限幅特征VSM的文本分类模型.pdf

通过文档基于模糊限定词的特征表达，定义特征的模糊函数，将文档表示为隶属度限幅的特征向量，构造文本集隶属度限幅的类特征矩阵，将每一类文本集映射为类期望向量，所有类期望向量便构成了隶属度限幅的特征VSM。

29 2019-09-20
搜狗文本分类语料库_中文文本分类

实现文本分类的主要包括几个步骤文本分词处理，特征选择，特征权重计算，文本特征向量表示，基于训练文本的特征向量数据训练SVM模型，对于测试集进行特征向量表示代入训练得到的svm模型中进行预测分类，达到9

67 2019-02-27
高性能特征选择及文本分类算法研究

本文针对现有特征选择算法没有利用有用的词条频率信息。没有定性分析的现状，提出了基于词条频率的改进特征选择算法，对特征选择算法进行了定性分，提出了构造高效特征选择方法的约束条件和步骤，构造出一种高效的特

54 2018-12-15
文本分类算法分析一种很好的文本分类算法

一种很好的分类算法，字数还得大于20，你爷爷的。好东西就是好东西。

43 2019-05-06
基于双向GRU和贝叶斯分类器的文本分类

基于BiGRU和贝叶斯分类器的文本分类,利用搜狐新闻数据集进行实现,对12个种类进行分类,里面设计BiGRUB提取文本特征,TF-IDF特征权重赋值,Bytes分类进行实现,学习深度学习和机器学习很好

16 2020-08-19
基于Web文本挖掘的SVM网页文本分类研究

互联网web网页，利用SVM技术实现对web进行挖掘、检索等，本文采用这种方法以处理海量数据，网页自动分类，通过自动分类建立数据库，提高搜索引擎的查全率和查准率，而且可以自动的分类信息资源，为用户提供

33 2018-12-20
最大熵的文本分类

最大熵模型用于文本分类的例子，里面有数据集和Python代码

16 2019-07-06
分本分类特征抽取

中文文本分类中特征抽取方法的比较研究：计算机应用；中文信息处理；文本自动分类；特征抽取；支持向量机；

24 2019-06-04

基于LDA特征扩展的短文本分类_吕超镇

用户评论

推荐下载