一种面向科技项目文本的相似度度量方法

sjz25179 19 0 PDF 2020-10-31 00:10:45

现有的文本相似度度量方法主要采用TF-IDF方法,把文本建模为词频向量,但未考虑文本的结构特征。现将文本的结构特征和TF-IDF方法进行融合,提出了一种面向科技项目文本的相似度度量方法。该方法首先对文本进行预处理,其次根据文本的结构特征提取模块文本,然后使用TF-IDF方法提取每个模块文本的TOP-N关键词, 作为模块文本的特征向量表示,最后使用余弦聚类计算文本的相似度。实验结果表明,在电力行业的科技项目文档数据集上,所提方法优于TF-IDF方法。

用户评论

暂无评论

论文研究一种改进的KNNWeb文本分类方法.pdf

KNN方法存在两个不足:a)计算量巨大，它要求计算未知文本与所有训练样本间的相似度进而得到k个最近邻样本；b)当类别间有较多共性，即训练样本间有较多特征交叉现象时，KNN分类的精度将下降。针对这两个问

37 2020-04-19
论文一种基于文本知识库的推理方法研究

论文《一种基于文本知识库的推理方法研究》

29 2018-12-09
论文研究一种用于新闻视频的文本定位方法.pdf

一种用于新闻视频的文本定位方法，时阳，，新闻视频中的字幕包含了丰富的语义信息。本文通过分析新闻视频中字幕的分布特征，并比较了多种文本定位方法，提出了一种适用于新

16 2020-07-21
一种改进的文本分类算法

文本分类技术是文本挖掘技术中的研究热点之一,但是传统KNN分类算法的时间复杂度高,在不均匀密度样本下分类准确率低。针对这些问题,提出一种在不均匀密度样本下的优化KNN算法:IKNN算法。首先选取样本分

7 2021-02-01
分享一种简单的文本日志

写入日志到文本文件,这是一个简单的.net记录日志方法。

30 2019-01-09
论文研究一种基于本体的概念语义相似度方法的研究.pdf

一种基于本体的概念语义相似度方法的研究，王家琴，李仁发，提出了一种计算不同本体中概念间语义相似度的方法,该方法通过比较实例间的相似度获得初始概念间语义相似度，然后结合影响概念间��

25 2020-05-04
图像相似度量原创图像相似.doc

图像相似度量原创-图像相似.doc 代码与测试图片: 图像相似度量代码.rar 文档: 图像相似.doc t1.jpg t2.jpg t3.jpg t4.jpg t5.jpg

23 2020-08-08
一种激光测距的方法

一种激光测距的方法

27 2019-04-02
论文研究一种基于过程改进的度量模型.pdf

如何提高软件质量始终是软件工程领域研究的重要方向，基于度量的量化管理是目前最有效的质量保证手段之一，过程度量是软件开发过程中实施软件质量保证(SQA)的一个重要课题。研究了软件过程度量的概念和范围，讨

39 2019-07-30
一种软件过程度量模型的研究与改进

随着软件的应用日益广泛,软件质量成为人们关注的对象,软件过程作为影响软件质量的重要方面,软件过程的度量显得非常重要。为了更好的对软件过程进行度量,为软件过程的改进提供更加详细和准确的数据,本文通过对软

9 2021-04-17

一种面向科技项目文本的相似度度量方法

用户评论

推荐下载