基于深度学习cnnrnn的中文期刊分类.zip
数据文件下载好放入2word2vec中模型文件下载好放入2word2vec中1dataclean为数据预处理由于数据文件本文已处理勿运行2word2vec为词嵌入模型3sklearn为项目的baseline特征工程朴素贝叶斯4cnn为卷积神经网络的文本分类调参很久未得到好结果5rnn为卷积神经网络的文本分类结果优于baseline选题意义期刊论文本数量增长迅速人工分类耗费精力某个实验表明相同的人在不同时间段对同一批文献分类不同的人对同一批文献分类得到的结果发现相差较大是因为人的主观性和知识结构的变迁会影响分类结果.机器分类不会存在此问题.项目目标建立合理的CNKI数据集样本地址对中图法分类的22个大类178个二级类分类实现正确区分reference对于中文期刊分类这一特定应用场景往往采用以下方案.采用向量空间模型VSM用一个向量表示一个文本.机器学习在中文期刊分类应用文章D k1k2k3k4k5..kn这是一个多维的向量如果维数很
文件列表
基于深度学习cnnrnn的中文期刊分类.zip
(预估有个22文件)
chinesemagazineclassification
2_word2vec
merge_data.py
478B
model_test.py
414B
new_test.py
2KB
train_word2vec_model.py
1KB
.~lock.cnki_wiki#
94B
.settings
org.eclipse.core.resources.prefs
443B
4_cnn
暂无评论