推荐下载
-
论文研究中文文本压缩的LZW算法.pdf
结合中文文本中的汉字编码方式、大字符集以及重复字串不长三个不同于英文文本的结构特点对LZW算法从读取数据方式、基本码集和字典码值输出方式三方面进行了修改。改进后的算法对中文文本的压缩比平均比LZW19
14 2020-07-17 -
中文文本语义相似度计算研究及应用
中文文本相似度讨算是中文信息处理相关研究领域中的重要基础, 在信息检索、 知识挖掘、 舆情分析等领域中有着广泛应用。 目前的中文文本相似度计算方 法大多是从文本的字形层面而不是从文本内容语义理解上计算
17 2020-07-17 -
中文文本分类_新闻语料库.zip
做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
19 2020-05-26 -
复旦大学中文文本分类测试集
内部是复旦大学中文文本分类测试集,含有多个行业类型,2积分是全网比较低
30 2019-03-04 -
中文文本分类语料_训练测试全集_复旦
本资源是复旦大学中文文本分类预料压缩包,包含训练与测试全集。
58 2018-12-25 -
搜狗中文文本分析语料库
搜狗实验室新闻数据精简版,将xml文本进行处理后分类如下:奥运5595个txt房产14695个txt互联网2200个txt健康1153个txt教育2075个txt军事593个txt旅游1802个txt
30 2019-05-15 -
复旦大学中文文本分类训练集
内部是复旦大学中文语料,含有多种行业类型,非常适合NLP学习使用,2个积分全网算是比较低
74 2019-05-17 -
中文文本自动分类方法的研究和实现
文档介绍了中文文本自动分类方法的研究和实现,在网络舆情监控的文本分类中有很重要的作用
21 2019-07-06 -
QT调用MS_SPEECH实现中文文本朗读
QT调用msSPEECH实现中文文本朗读,可极大的提升系统友好亲切感。
17 2019-07-11 -
基于SVM的中文文本自动分类研究.PDF
Chinese text automatic classification based on SVM. PDF
25 2019-06-22
用户评论