论文研究 微博文本聚类中特征扩展策略研究.pdf

sharon_JIAN 19 0 PDF 2020-07-16 20:07:32

针对微博文本高维、稀疏的特点,比较基于同义词词林等外部知识库的文本扩展策略,利用Word2vec训练微博语料,并构建微博上下文相关词词表,通过种子词表和微博标签信息去扩展微博文本流中的关键词,最后提出了提取微博文本关键词及区分词向量中相似词和相关词的方法。实验结果证明,微博短文本经过Word2vec词向量相关词及微博标签扩展后,其聚类效果有了明显提高。

论文研究 微博文本聚类中特征扩展策略研究.pdf

用户评论
请输入评论内容
评分:
暂无评论