基于向量空间模型的文本聚类算法.doc
基于向量空间模型的文本聚类算法 姚清耘,刘功申,李 翔 (上海交通大学信息安全工程学院,上海 200240 摘 要:文本聚类是聚类的一个重要研究分支,是聚类方法在文本处理领域的应用该文探讨了基于向量空间模型的文本聚类方法,提出了一种文本聚类的改进算法LP 算法同时,基于语料库的实际聚类效果,就维度确定特征选择等方面提出优化方案实验证明,LP 算法有效地减少了聚类所消耗的时间,实用性和灵活性都较高
用户评论
推荐下载
-
基于向量空间模型的文本自动分类系统的研究与实现
基于向量空间模型的文本自动分类系统的研究与实现
37 2018-12-07 -
VSM向量空间模型doc
VSM向量空间模型doc
31 2019-01-16 -
简单向量空间模型VSM算法的实现
简单向量空间模型VSM算法的实现
41 2019-01-16 -
文本挖掘聚类分析空间向量模型资料2
文本挖掘聚类分析空间向量模型资料2
38 2019-03-03 -
文本挖掘聚类分析空间向量模型资料1
文本挖掘聚类分析空间向量模型资料1
50 2019-03-03 -
基于向量空间模型的多主题Web文本分类方法
基于向量空间模型的多主题Web文本分类方法.pdf
28 2019-05-06 -
VSM向量空间模型对文本的分类以及简单实现
VSM向量空间模型对文本的分类以及简单实现
45 2019-05-16 -
基于向量空间模型的文本分类特征权重算法研究_苏力华
介绍了向量空间模型的文本分类特征权重算法以及改进
48 2019-05-16 -
基于向量空间模型的文本自动分类系统的研究与实现
空间向量模型的技术实现文献。请各位多多指教!
32 2019-09-17 -
基于向量空间模型的中文文本分类技术研究
0引言伴随着文本挖掘技术的发展,文本分词技术作为文本挖掘技术的一个重要研究分支,也得到了迅速的发展.文本分词技术为大多数文本挖掘技术(如文本分类技术,文本聚类技术等)提供文本预处理工作,分词效果的好坏
28 2019-09-20 -
基于文本的特征向量空间的提取
用TFIDF和特征增益两种方式实现了特征向量空间的建立,将文本文件表示成特征向量的形式,为接下来的聚类做了准备。程序用JAVA写成。
36 2020-05-19 -
用Python给文本创立向量空间模型的教程
这是因为它们不在同一词汇空间中。我们想要对每一个词频向量进行比例缩放,使其变得更具有代表性。现在仅仅接受这样一个事实:我们需要确保每个向量的L2范数等于1。你看到了,一个计数为1的词在一个向量中的值和
16 2020-12-16 -
基于过滤模型的聚类算法
合理的聚类原型是正确聚类的前提.针对现有聚类算法原型选取不合理、计算聚类个数存在偏差等问题,提出基于过滤模型的聚类算法(CA-FM).算法以提出的过滤模型去除干扰聚类过程的边界和噪声对象,依据核心对象
19 2021-01-16 -
基于向量空间模型的中文文本相似度的研究
在文本聚类中需要衡量中文文本之间的相似性。本文首先讨论了文本相似度的概念和常用计算算法,详细介绍了向量空间模型和算法步骤,采用删除去除词表、近义词合并、修改文件长度3中策略对算法进行了改进。最后借助盘
16 2021-01-31 -
基于词向量和EMD距离的短文本聚类
短文本聚类在数据挖掘中发挥着重要的作用,传统的短文本聚类模型存在维度高、数据稀疏和缺乏语义信息等问题,针对互联网短文本特征稀疏、语义存在奇异性和动态性而导致的短文本聚类性能较差的问题,提出了一种基于特
18 2021-02-23
暂无评论