word2vec词向量训练及中文文本相似度计算
用来得到TXT文本中词语的相关性的深度学习模型,需要分词,text8为样例,运行脚本可以直接开始训练。最后得到.bin模型
用户评论
推荐下载
-
英文文本相似度文本推理文本匹配数据集MUltiNLI
英文文本相似度/文本推理/文本匹配数据集——MUltiNLI
51 2020-12-30 -
英文文本相似度文本推理文本匹配数据集SNLI
英文文本相似度/文本推理/文本匹配数据集——SNLI
23 2020-12-30 -
英文文本相似度文本推理文本匹配数据集SICK
英文文本相似度/文本推理/文本匹配数据集——SICK
14 2020-12-30 -
英文文本相似度文本推理文本匹配数据集STS
英文文本相似度/文本推理/文本匹配数据集——STS
32 2020-12-30 -
用gensim word2vec实现词矢量化
''' 文本特征学习-词矢量化 Word2vec 用Python包genism实现 ''' import gensim from gensim.models import word2vec, Word
13 2021-01-30 -
word2vec gensim wiki english使用Wiki英语数据集训练您自己的word2vec嵌入源码
word2vec-gensim-wiki-中文 使用Wiki英语数据集训练您自己的word2vec嵌入 您可能需要预先训练的word2vec向量,并且此可能对您来说是个好主意。 但是,棘手的是使用Wi
6 2021-04-26 -
Python Lit2Vec使用Word2Vec算法将书籍表示为向量
Lit2Vec - 使用Word2Vec算法将书籍表示为向量
14 2020-07-17 -
中文文本相似度匹配算法simHash海明距离IK分词
中文文本相似度匹配算法simHash海明距离IK分词完整的可运行的示例代码包含simHash算法,使用IK对中文文本进行分词处理
60 2019-06-05 -
训练好的Word2vec词向量135G使用120G大语料库所得
训练所采用的语料如下: 12G百度百科词条 20G小说 90G的其他爬虫语料 训练得到词库1.35G,bin和model格式
131 2019-02-27 -
文本相似度对比器Java
Text Similarity Comparator (Java)
56 2019-06-26
暂无评论