随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技末1由于最大嫡模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结来.但是,将最大嫡模型应用在文本分类中的研
1.文本类别数10类2.训练集文档数50000篇每类平均5000篇.3.测试集文档数50000篇每类平均5000篇.分组完成实验组员数量3个人实现可以获得实验加分.实验内容利用分类算法实现对文本的数据
利用支持向量机实现中文文本分类.zip
本节资料是练习RNN文本分类的数据,数据有是10类别,模型采用两层的LSTM网络。数据包含了测试集,训练集和验证集,并且代码讲解很详细,是联系RNN网络LSTM实现的好数据。
机器学习文本分类训练集,用于机器学习算法的训练。复旦大学
该语料一共九个类,每类500个文档,是我从搜狗Reduced语料中抽取的类内耦合度较大的一部分语料,比较适合聚类。
搜狗实验室文本分类语料库。可用于进行文本开发等相应实验练习
用于libsvm分类的语料,包含训练数据和测试数据,格式为libsvm要求的格式,可用于libsvm工具的练习
我的专业工作案例可以从以下链接下载: http://pan.baidu.com/s/1dDIlXXB 需要预先安装同一目录下的VB6运行环境,然后才可以安装应用程序。 安装和测试过程中有问题可以直接联
复旦大学新闻语料库,此为训练集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组