word2vecsentimentsIMDBData.zip
词向量在NLP被广泛应用,通过引入Doc2Vec,不仅可以对单个词进行词向量表示,而且可以对整个句子或文章进行表示。 想象一下,能够使用固定长度的向量表示整个句子,然后我们可以使用标准的分类算法去分类。是一件很神奇的事情。 本章以Word2Vec 为基础,使用Doc2Vec 来做些情感分析的任务问题。 IMDB预料 进行分类(积极or消极),可以提供的数据集
文件列表
word2vec-sentiments-IMDB-Data.zip
(预估有个4文件)
test-pos.txt
14.84MB
train-pos.txt
15.36MB
train-neg.txt
14.81MB
test-neg.txt
14.61MB
暂无评论