(JWPL)基于维基百科的中文短文本分类研究
JWPL(JavaWikipediaLibrary)是一个开源的访问wikipeida数据的javaapi包。该文讲述了如何使用JWPL
用户评论
推荐下载
-
CLUE TNEWS新闻短文本分类数据集
CLUE TNEWS是一个中文新闻短文本分类数据集,涵盖了今日头条平台上的各类新闻。数据集分为训练集(53,360条)、验证集(10,000条)和测试集(10,000条),为文本分类任务提供了丰富且多
3 2024-05-12 -
Python词向量短文本分类包shorttext
Various Algorithms for Short Text Categorization
31 2020-07-22 -
基于svm的中文文本分类
基于svm的中文文本分类
20 2019-06-04 -
维基百科中文语料word2vec训练后结果
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链
35 2019-07-11 -
中文文本分类中文本表示及分类算法研究
本文档是一篇硕士学位论文,题目是《中文文本分类中文本表示及分类算法研究》,详细的介绍了文本分类的表示方法及分类算法,值得参考
50 2019-09-25 -
文本分类机器学习中文本分类的介绍
文本分类,语义学习都是机器学习和深度学习中比较重要的部分,本文档详细的介绍了文本分类这一思想,是一份非常值得学习的资料!
44 2019-01-11 -
基于关联规则的文本分类研究
文档介绍了文本分类中基于关联规则的分类研究,在舆情监控中有很重要的研究意义。
28 2018-12-15 -
基于混合特征的文本分类研究
文本分类技术作为文本数据处理的一种重要手段,如何提高文本分类的效率具有重大的意义。基于传统的文本分类技术采用TFIDF算法计算权重没有考虑特征项在类别间的分布情况而影响了文本分类效果。本文通过对TFI
11 2021-01-16 -
基于概念网络的文本分类研究
提出了一种基于概念网络和主题概念树的文本分类算法。该算法可以根据关联度传播模型对未知文本中的一些概念进行一定程度上的语义复合。
24 2021-01-19 -
论文研究融合BTM主题特征的短文本分类方法.pdf
针对短文本特征较少而导致使用传统文本分类算法进行分类效果并不理想的问题,提出了一种融合BTM主题特征和改进了特征权重计算的综合特征提取方法来进行短文本分类。方法中,在TF-IWF的基础上降低词频权重并
17 2020-05-18
暂无评论