基于 word2vec 计算文本相似度的话题聚类研究
本文设计并实现了一个微博交通内容的热门话题发现及文本聚类系统,便于及时捕获出微博中的交通话题,有助于更快速准确地对交通事件做出预判和决策。为了能在聚类中更准确地对文本进行相似度计算,本文采用word2vec将词语表示成词向量,并提出了一种基10于稠密特征的DC-word2vec算法,通过引入高频网络词组成的高维词表对特征向量进行扩维映射,使其变得稠密化且每一维度都有了具体的实际意义。通过对比其他几类算法的计算相似度准确率,验证了DC-word2vec的效果最佳,并将其应用到K-means聚类中,有效提升了话题聚类的精度。
推荐下载
-
word2vec源码与原理
资源包括word2vec源码与Deep_Learning实战之word2vec.pdf
25 2019-01-07 -
word2vec词向量入门
word2vec词向量入门
36 2019-01-01 -
DeepLearning实战之Word2Vec
Deep Learning已经很火了,本文作者算是后知后觉者,主要原因是作者的目前工作是广告点击率预测,而之前听说Deep Learning最大的突破还是在图像语音领域,而在NLP和在线广告点击预测方
34 2019-01-08 -
DeepLearning实战之Word2vec
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征
20 2019-01-08 -
Deeplearning实战之word2vec
Deep learning实战之word2vec,共23页,是个特别详细的教程,包括了:入门,模型、分布式实现、参考代码··,适合初学者学习并且练习。
20 2019-01-08 -
文本分析gensim库word2vec学习笔记
文章目录模型原理模型参数建立模型模型的建立模型的保存保存与继续训练模型还是保存模型问题再训练模型评估模型使用查看每一个词语对应的向量表示查看与某个词语相似度排名的其他词语找到不同类型的词语 写在前面:
8 2021-01-10 -
word2vec学习文本数据数据集
word2vec学习文本数据-数据集
9 2021-04-29 -
基于隐马尔科夫模型文本相似度研究
基于隐马尔科夫模型文本相似度研究
11 2020-09-14 -
文本相关性相似性聚类演示程序
我的专业工作案例可以从以下链接下载:http://pan.baidu.com/s/1dDIlXXB需要预先安装同一目录下的VB6运行环境,然后才可以安装应用程序。安装和测试过程中有问题可以直接联系我。
33 2019-06-01 -
论文研究基于语言网络和语义信息的文本相似度计算.pdf
通过分析已有的基于统计和基于语义分析的文本相似性度量方法的不足,提出了一种新的基于语言网络和词项语义信息的文本相似度计算方法。对文本建立语言网络,计算网络节点综合特征值,选取TOP比例特征词表征文本,
16 2020-07-16
用户评论