doc2vec:使用Doc2Vec嵌入的长文本表示和分类 源码
Doc2Vec文本分类 文本分类模型,该模型使用gensim Doc2Vec生成段落嵌入,并使用scikit-learn Logistic回归进行分类。 数据集 25,000个IMDB电影评论,特别选择用于情感分析。 评论的情绪是二进制的(1表示肯定,0表示否定)。 与以下出版物相关联地收集了此源数据集: Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng, and Christopher Potts. (2011). "Learning Word Vectors for Sentiment An
文件列表
doc2vec-master.zip
(预估有个13文件)
doc2vec-master
models
classifier_model.py
3KB
model.py
261B
__init__.py
0B
doc2vec_model.py
4KB
requirements.txt
63B
.travis.yml
155B
LICENSE
1KB
README.md
1KB
暂无评论