改进K-Means算法在文本聚类中的应用
摘刁石3七 随着Intemet的大规模普及和企业信息化程度的提高,无结构(如HTML和纯文本文 件)或半结构(如XML数据)化的文本数据正在以惊人的速度增长,文本数据的管理和分 析就变得空前重要。聚类技术作为文本信息挖掘技术中的核心技术之一,其目标是将文 档集合分成若干个簇,要求同一簇内文档内容的相似度尽可能的大,而不同簇之间的相 似度尽可能的小。 自20世纪50年代以来,人们提出了多种聚类算法,大致可分为基于划分和基于层 次的两种。在基于划分的聚类算法中,最著名的是K一MeanS算法。自 1967年由MacQueen 首次发表后,目前已经成为数理统计、模式识别、机器学习和数据挖掘等领域应用最
用户评论
推荐下载
-
文本聚类算法在舆情监控中的应用分析
为满足网络舆情监控系统中话题发现的需要,并克服经典single-pass算法在处理网络文本聚类时受输入顺序及精度较低的不足,本文对single-pass聚类算法进行改进,通过采用a
13 2021-02-01 -
聚类算法的介绍EM算法和K_means
这是一个有关于聚类算法的ppt讲义,里面有涉及到常见的EM算法和K平均值算法
56 2019-05-08 -
基于分层聚类的k means
分层聚类算法的优点在于它可以在不同粒度上对数据进行探测, 然而一旦出现一组对象合并时, 类之间就不能交换对象, 因此在合并前, 必须花费大量时间计算单链接距离( 或全链接距离)
20 2021-04-03 -
K means聚类python代码
基于python的k-means聚类算法的实现代码,不是调用sklearn库的实现方式,步骤清晰且比较详细!如有错误,欢迎批评指出,谢谢!
22 2020-10-31 -
k means教程代码聚类
```python # k means教程代码(聚类) # 0.引入依赖 import numpy as np import matplotlib.pyplot as plt # 从sklearn中直
19 2020-12-23 -
k_means聚类程序
matlab中k-means聚类的小程序。
30 2019-01-16 -
K_means聚类程序
这是k-means的MATLAB程序,主要用于各种数据的聚类等情况
65 2019-01-22 -
k_means聚类讲解
非常好的k-means聚类算法讲解幻灯片,生动形象,深入浅出!
44 2018-12-29 -
基于K means算法的最佳聚类数研究
针对聚类算法在实现的过程中需要预先设定最终聚类数目的问题,提出了基于同类全部样本的类内紧密度和类间离差度的一种新聚类有效性指标,通过该指标能够有效地确定数据集的最佳聚类簇数。在确定最佳聚类数的过程中采
27 2021-01-16 -
python基于K means聚类算法的图像分割
主要介绍了python基于K-means聚类算法的图像分割,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
16 2020-09-21
暂无评论