论文研究最优聚类个数和初始聚类中心点选取算法研究.pdf

Xieminsen 22 0 PDF 2020-07-19 17:07:58

传统K-means算法的聚类数k值事先无法确定，而且算法是随机性地选取初始聚类中心点，这样容易造成聚类结果不稳定且准确率较低。基于SSE来选取聚类个数k值，基于聚类中心点所在的周围区域相对比较密集、聚类中心点之间距离相对较远的选取原则来选取初始聚类中心点，避免初始聚类中心点集中在一个小的范围，防止陷入局部最优。实验证明，该算法能选取最优的k值，通过用标准的UCI数据库进行实验，采用的算法能选择出唯一的初始中心点，聚类准确率较高、误差平方和较小。

资源预览

用户评论

暂无评论

论文数据挖掘中聚类算法比较研究

论文《数据挖掘中聚类算法比较研究》 ,和大家分享~~~

15 2021-04-26
聚类问题算法研究_优秀硕士论文

优秀硕士论文，关于聚类问题的算法研究，k-means算法的实现

25 2018-12-25
论文研究二元数据子空间聚类算法的初始化研究.pdf

针对二元数据空间高维稀疏性的特点而提出的有限混合伯努利模型，能够快速寻找映射簇的模型框架；EM算法是数学模型进行参数迭代的重要方法，其算法的优劣很大程度上取决于其初始参数。对于运用EM算法来实现有限混

24 2019-09-26
论文研究基于PLSI的标签聚类研究.pdf

针对现有的大众分类中标签模糊导致影响用户搜索效率的问题,使用概率潜在语义索引(probabilisticlatentsemanticindexing,PLSI)模型对标签进行潜在语义分析,经回火期望最

24 2020-05-15
论文研究聚类趋势问题的研究综述.pdf

聚类算法的性能与数据集的结构是密切相关的，虽然目前已经研究出了很多聚类算法，但没有普遍适用的万能聚类算法，欠缺对数据集结构的有效解释。对聚类分析过程中重要的关键性问题，即聚类趋势问题进行了系统性的研究

20 2020-07-16
论文研究聚类有效性研究综述.pdf

论文研究-聚类有效性研究综述.pdf, 聚类是一个无监督学习过程，因此确定最佳聚类数是一项困难的工作. 聚类有效性研究是通过建立聚类有效性指标，评价聚类质量并确定最佳聚类数的过程. 首先，介绍了聚类

20 2020-07-16
基于平均差异度优选初始聚类中心的改进K均值聚类算法

针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选

16 2021-01-16
K_means算法的初始聚类中心的优化

摘要:传统的K-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,针对K-means算法存在的问题,提出了基于密度的改进的K-means算法,该算法采取聚类对象分布密度方法来确定初始聚

34 2019-09-23
文本聚类中基于密度聚类算法的研究与改进

文本聚类在很多领域都有广泛应用,而聚类算法作为文本聚类的核心直接决定了聚类的效果和效率。结合基于划分的聚类算法和基于密度的聚类算法的优点,提出了基于密度的聚类算法DBCKNN。算法利用了k近邻和离群度

17 2020-12-23
论文研究基于全局性确定聚类中心的文本聚类.pdf

针对数字图像取证中一类常见的图像篡改-复制粘贴图像伪造，提出了一种利用小波变换和图像块灰度分布提取特征的检测算法。相对于原图，小波分解的低频子带仍然保持原图像的概貌和空间特性，但在尺寸上减小了很多；对

15 2020-07-16

论文研究 最优聚类个数和初始聚类中心点选取算法研究.pdf

资源预览

用户评论

推荐下载

论文研究最优聚类个数和初始聚类中心点选取算法研究.pdf