doc2vec:使用Doc2Vec嵌入的长文本表示和分类源码

qqpaw20726 27 0 ZIP 2021-02-21 08:02:01

Doc2Vec文本分类文本分类模型,该模型使用gensim Doc2Vec生成段落嵌入,并使用scikit-learn Logistic回归进行分类。数据集 25,000个IMDB电影评论,特别选择用于情感分析。评论的情绪是二进制的(1表示肯定,0表示否定)。与以下出版物相关联地收集了此源数据集: Andrew L. Maas, Raymond E. Daly, Peter T. Pham, Dan Huang, Andrew Y. Ng, and Christopher Potts. (2011). "Learning Word Vectors for Sentiment An

文件列表

doc2vec-master.zip (预估有个13文件)

doc2vec-master

models

classifier_model.py 3KB

model.py 261B

__init__.py 0B

doc2vec_model.py 4KB

requirements.txt 63B

.travis.yml 155B

LICENSE 1KB

README.md 1KB

text_classifier.py 2KB

classifiers

__init__.py 0B

data

__init__.py 0B

dataset.csv 32MB

.gitignore 2KB

用户评论

暂无评论

doc2vec原论文

为更好的理解doc2vec方法，请详细阅读原论文。仅供学习使用，禁止商业用途。版权作者所有，如有侵权请联系删除。

14 2019-07-13
sklearn doc2vec gensim doc2vec实现的scikit learn包装器源码

Doc2vec用于scikit学习该项目使您能够将gensim的Doc2vec实现用作sklearn变压器,并无缝集成到管道中。正在安装确保运行setup.sh脚本。它将安装所有必需的依赖项。

15 2021-03-16
doc2vec的java实现

DOC2vec，是为一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络，用来训练以重新建构语言学之词文本。

25 2019-08-02
doc2vec在线训练程序

主要用于文本的量化处理，非常适合计算文本的相似度以及文本分类，相比于tf-idf更优。

13 2019-07-17
doc2vec训练与相似度计算.rar

相似度计算,句向量,人工智能,文本抽取,深度学习,

9 2020-08-18
search_panre doc2vec을사용한 源码

용한이용한시스시스템 사용기술 파이썬(Python) PHP 기계학습(机器学习) 아파치HTTP서버(XAMPP) Word(Word2Vec) 분석(Komoran) 프로그램의 이텔릭체는 (

3 2021-02-25
推荐系统Lambda架构算法十一基于内容的电影推荐物品冷启动处理word2vec Doc2Vec

文章目录基于内容的电影推荐:物品冷启动处理word2vec原理简介Word2VecWord2Vec使用Doc2Vec使用基于内容的电影推荐:物品冷启动处理利用Word2Vec可以计算电影所有标签词

8 2020-12-31
awesome2vec2vec型嵌入模型的精选列表源码

awesome-2vec:2vec型嵌入模型的精选列表

20 2021-02-01
Top2Vec Top2Vec学习联合嵌入的主题文档和单词向量源码

更新:现在可以嵌入预训练的通用句子编码器和BERT句子转换器。阅读。 Top2Vec Top2Vec是用于主题建模和语义搜索的算法。它会自动检测文本中存在的主题,并生成联合嵌入的主题,文档和单词向量。

6 2021-04-20
node2vec node2vec算法的实现源码

Node2Vec node2vec算法Aditya Grover,Jure Leskovec和Vid Kocijan的Python3实现。安装 pip install node2vec 用法 imp

25 2021-02-08

doc2vec:使用Doc2Vec嵌入的长文本表示和分类 源码

文件列表

用户评论

推荐下载

doc2vec:使用Doc2Vec嵌入的长文本表示和分类源码