电影评论情感分析:训练了一种二进制分类模型可基于该评论中使用的单词来预测电影评论的情绪 源码
1引言 该项目致力于利用成千上万条带有标签的电影评论来训练二进制分类模型,该模型将纯粹基于评论中的单词来预测新电影评论的情绪。 为了完成此任务,此存储库中包含以下文件: alldata.tsv :此文件包含评论的完整数据集以及用于训练和测试模型的相关标签。 create_vocab.R :这是用于从训练数据生成词汇表的脚本。 该词汇表中的术语用于训练逻辑回归分类器。 myvocab.txt :这是从create_vocab.R脚本生成的选定术语的列表。 mymain.R :此文件包含用于训练模型并评估测试集上的结果(使用AUC)的代码。 eval_code.R :这是用于为五个分割
文件列表
Movie-Review-Sentiment-Analysis-main.zip
(预估有个22文件)
Movie-Review-Sentiment-Analysis-main
split_5
test.tsv
31.45MB
test_y.tsv
244KB
train.tsv
31.6MB
myvocab.txt
7KB
mymain.R
2KB
splits_F20.csv
705KB
create_vocab.R
3KB
README.md
10KB
暂无评论