基于LDA高频词扩展的中文短文本分类胡勇军
针对短文本特征稀疏、噪声大等特点,提出一种基于 LDA 高频词扩展的方法,通过抽取每个类别的高频词作为向量空间模型的特征空间,用 TF-IDF 方法将短文本表示成向量,再利用 LDA 得到每个文本的隐主题特征,将 概率大于某一阈值的隐主题对应的高频词扩展到文本中,以降低短文本的噪声和稀疏性影响。实验证明,这种方法的分类性能高于常规分类方法
用户评论
推荐下载
-
达观文本分类
基于文本分类的代码数据,多分类问题。使用传统自然语言处理技术和深度学习技术
19 2019-09-20 -
textCNN文本分类
textCNN文本分类
5 2021-04-29 -
文本分类基础
有关文本分类的国外经典书籍
29 2019-01-02 -
TMSVM文本分类
TMSVM文本分类 基于协同理论的篇章语义自动分析研究
26 2019-01-02 -
文本分类工具
这是目前来讲相对较好的文本分类工具,欢迎大家使用下载!
14 2020-08-09 -
文本分类介绍
对文本分类方法介绍,主要适用于图书情报检索学习。
14 2020-08-11 -
基于云计算的中文文本分类方法的研究
硕士论文选辑(一)。 With the developing of Internet and the increasing of users , the Chinese text for the In
19 2019-01-12 -
Python用于长文本分类的各种基线模型文本分类
allkindsofbaselinemodelsforlongtextclassificaiton(textcategorization)
56 2020-06-08 -
一种改进的贝叶斯网络短文本分类算法
对于短文本由于其特征数少而使分类效果不理想的情况,本文提出了一种改进的的贝叶斯网络文本分类算法,改进之处在于贝叶斯网络结构学习阶段的寻找父节点步骤,本文算法在考虑了连接强度的因素后,减少了本来不相关的
8 2021-02-23 -
基于tensorflow实现CNN文本分类
基于tensorflow实现CNN文本分类目前文本分类问题主要使用的RNN/LSTM,但是本身具有时序性强、速度慢等局限性。而CNN的主要特点是速度快,主要用于计算机图像的核心部分GPU的硬件层实现。
49 2019-05-02
暂无评论