一种面向科技项目文本的相似度度量方法
现有的文本相似度度量方法主要采用TF-IDF方法,把文本建模为词频向量,但未考虑文本的结构特征。现将文本的结构特征和TF-IDF方法进行融合,提出了一种面向科技项目文本的相似度度量方法。该方法首先对文本进行预处理,其次根据文本的结构特征提取模块文本,然后使用TF-IDF方法提取每个模块文本的TOP-N关键词, 作为模块文本的特征向量表示,最后使用余弦聚类计算文本的相似度。实验结果表明,在电力行业的科技项目文档数据集上,所提方法优于TF-IDF方法。
用户评论
推荐下载
-
论文研究一种改进的KNNWeb文本分类方法.pdf
KNN方法存在两个不足:a)计算量巨大,它要求计算未知文本与所有训练样本间的相似度进而得到k个最近邻样本;b)当类别间有较多共性,即训练样本间有较多特征交叉现象时,KNN分类的精度将下降。针对这两个问
37 2020-04-19 -
论文一种基于文本知识库的推理方法研究
论文《一种基于文本知识库的推理方法研究》
29 2018-12-09 -
论文研究一种用于新闻视频的文本定位方法.pdf
一种用于新闻视频的文本定位方法,时阳,,新闻视频中的字幕包含了丰富的语义信息。本文通过分析新闻视频中字幕的分布特征,并比较了多种文本定位方法,提出了一种适用于新
16 2020-07-21 -
一种改进的文本分类算法
文本分类技术是文本挖掘技术中的研究热点之一,但是传统KNN分类算法的时间复杂度高,在不均匀密度样本下分类准确率低。针对这些问题,提出一种在不均匀密度样本下的优化KNN算法:IKNN算法。首先选取样本分
7 2021-02-01 -
分享一种简单的文本日志
写入日志到文本文件,这是一个简单的.net记录日志方法。
30 2019-01-09 -
论文研究一种基于本体的概念语义相似度方法的研究.pdf
一种基于本体的概念语义相似度方法的研究,王家琴,李仁发,提出了一种计算不同本体中概念间语义相似度的方法,该方法通过比较实例间的相似度获得初始概念间语义相似度,然后结合影响概念间��
25 2020-05-04 -
图像相似度量原创图像相似.doc
图像相似度量原创-图像相似.doc 代码与测试图片: 图像相似度量代码.rar 文档: 图像相似.doc t1.jpg t2.jpg t3.jpg t4.jpg t5.jpg
23 2020-08-08 -
一种激光测距的方法
一种激光测距的方法
27 2019-04-02 -
论文研究一种基于过程改进的度量模型.pdf
如何提高软件质量始终是软件工程领域研究的重要方向,基于度量的量化管理是目前最有效的质量保证手段之一,过程度量是软件开发过程中实施软件质量保证(SQA)的一个重要课题。研究了软件过程度量的概念和范围,讨
39 2019-07-30 -
一种软件过程度量模型的研究与改进
随着软件的应用日益广泛,软件质量成为人们关注的对象,软件过程作为影响软件质量的重要方面,软件过程的度量显得非常重要。为了更好的对软件过程进行度量,为软件过程的改进提供更加详细和准确的数据,本文通过对软
9 2021-04-17
暂无评论