本文针对现有特征选择算法没有利用有用的词条频率信息。没有定性分析的现状,提出了基于词条频率的改进特征选择算法,对特征选择算法进行了定性分,提出了构造高效特征选择方法的约束条件和步骤,构造出一种高效的特
复旦中文文本数据集,包含训练集与测试集,数据集为TXT格式,可以进行文本分类实验,机器学习,深度学习,需要的可以下载。
“复旦大学计算机信息与技术国际数据库中心自然语言处理小组”提供的小样本中文文本分类语料,分为训练集和测试集两部分。内容真实有效
中文文本分类语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技末1由于最大嫡模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结来.但是,将最大嫡模型应用在文本分类中的研
很全的中文文本分类语料库可以用于文本分类文本聚类C000007汽车C000008财经C000010ITC000013健康C000014体育C000016旅游C000020教育C000022招聘C000
利用支持向量机实现中文文本分类.zip
1.文本类别数10类2.训练集文档数50000篇每类平均5000篇.3.测试集文档数50000篇每类平均5000篇.分组完成实验组员数量3个人实现可以获得实验加分.实验内容利用分类算法实现对文本的数据
提出了一种面向任务的软件过程控制模型,旨在提高软件过程控制能力、促进CMM/CMMI的实施。该控制模型采用面向任务的调度思想,将软件过程划分为一系列任务。采用有限域约束规划方法建立约束模型,生成任务调
采用预训练字符向量的中文文本分类,关沫,刘坤,由于中文字符与其他字母语言所含字符存在巨大差异,主要表现在中文所含字符数量更大以及字符所含信息更丰富,将字符级卷积神经网