论文研究基于VSM和LDA模型结合的文本分类 .pdf
用户评论
推荐下载
-
论文研究基于LDA模型的Adhoc信息检索方法研究.pdf
传统的话题模型假设每个文档只属于一个话题,而实际情况下一个文档往往与多个话题相关。应用LDA模型将文档表示为多个话题的组合,并基于语言模型框架,提出了一种基于LDA的混合模型用于文本信息的Adhoc检
38 2019-09-09 -
研究论文基于特征项扩展的中文文本分类方法
提出了一种基于特征项扩展的中文文本分类方法.该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能
10 2020-08-11 -
基于CRFs的中文分词和短文本分类技术.pdf
本文的工作主要包括两部分:第一部分,我们借用了文本分类领域的特征选择算法对中文分词中的特征进行分析。分析结果表明,特征选择算法在中文分词的任务中也是适用的。在中文分词领域,基于字标注的方法得到广泛应用
64 2018-12-26 -
论文研究文本分类中信息增益特征选择方法的研究.pdf
分析了传统信息增益(IG)特征选择方法忽略了特征项在类间、类内分布信息的缺点,引入类内分散度、类间集中度等因素,区分与类强相关的特征;针对传统信息增益(IG)特征选择方法没有很好组合正相关特征和负相关
29 2020-07-22 -
KNN文本分类算法研究
一片论文针对knn算法进行了解释与优化。
25 2019-07-15 -
论文研究结合产品特征的评论情感分类模型.pdf
结合不同产品的评论词信息来构建智能化的情感分类器,提出一种结合产品特征的在线商品评论情感分类模型PWCNN(Product Weight Convolution Neural Network)。模型首
21 2020-07-29 -
基于支持向量机的文本分类方法研究
此文档中介绍的基于支持向量机的文本分类方法是网络舆情分析中常用的文本分类
34 2019-07-27 -
论文研究基于联合提取特征的粗糙集文本分类技术研究.pdf
重点研究了文本的特征提取,通过对互信息和χ2统计的研究,根据其各自的缺陷,提出了一种新的特征提取算法——联合特征提取算法(CEFA)。通过CEFA可以提取出更具代表性的特征项,利用粗糙集优越的约减性构
24 2019-09-18 -
论文研究基于LDA模型的微博话题检测.pdf
基于LDA模型的微博话题检测,汪进祥,刘念,随着微博用户的不断增长,国外的Twitter和国内的新浪微博已经成为媒体和个人发布信息的重要平台.对于微博这种特殊的文本,通常小于140��
22 2020-03-12 -
论文研究不均衡数据集上文本分类方法研究.pdf
文本分类中数据集的不均衡问题是一个在实际应用中普遍存在的问题。从特征选择优化和分类器性能提升两方面出发,提出了一种组合的不均衡数据集文本分类方法。在特征选择方面,综合考虑特征项与类别的正负相关特性及类
29 2020-03-02
暂无评论