论文研究基于Spark的分布式近邻传播聚类算法 .pdf

宛陵秋 26 0 PDF 2020-05-18 06:05:13

基于Spark的分布式近邻传播聚类算法，刘新生，于艳华，在大规模聚类算法的应用方面，近邻传播聚类(affinitypropagation,AP)克服了传统的K-means算法需要手动指定聚类个数的局限性，能够自动选择

推荐下载

论文《聚类算法研究》,和大家分享~~~~

针对传统的BIRCH算法用直径来控制聚类的边界,对非球形聚类效果不佳,甚至会把非球状的簇分割为不同簇这一缺点,对BIRCH算法进行改进,改进算法首先建立多棵CF树,每棵CF树代表一个簇,并结合DBSC

首先介绍传统距离计算方法在聚类应用中的不足,并针对这点提出一种基于权重向量的相对距离计算方法。在应用DBSCAN算法的基础上,融入相对距离的计算及k-d树的范围查找的应用。该算法不仅能得到很好的聚类效

针对传统K-medoids聚类算法对初始中心点敏感,以及迭代次数较高等缺点,提出一种可行的初始化方法和中心点搜索更新策略。新算法首先利用密度可达思想为数据集中每个对象建立一个稠密区域,遴选出[K]个密

针对传统BA(蝙蝠)算法易被局部极值吸引、发生过早收敛等问题,将莱维飞行搜索策略引入传统BA算法对蝙蝠的位置和速度更新方式进行改进,从而提高算法的全局搜索能力；通过引入非线性惯性权重平衡算法的全局和局

CABPM:基于模式匹配的聚类算法,方应飞,,本文通过研究一种快速前向模式匹配算法Rete算法,从一个新的角度重新分析设计了聚类算法-基于模式匹配的聚类算法( A Clustering Algori

基于聚类算法的Web日志挖掘,徐翔,谢东亮,随着互联网的迅速发展,WWW网站中的日志信息现已呈现出爆炸式增长趋势。为了能充分挖掘Web日志中潜在的有效信息,本文提出一种Web日

模糊C均值算法(FuzzyC-Means,FCM)是目前应用比较广泛的一种聚类算法。FCM算法的聚类质量依赖于初始聚类中心的选择并且易陷入局部极值,结合混合蛙跳算法(ShuffledFrogLeapi

首先总结了链接挖掘中基于属性—链接聚类算法的研究现状；然后把它大体分为三类,对每一类中具有代表性的算法进行了详细介绍、分析和评价；最后指出了该领域进一步的研究方向。

针对K-means算法处理海量数据存在严重的内存不足,提出利用MapReduce并行化K-means,但是普通的K均值存在收敛速度慢、易陷入局部最优和对初始聚类中心的选取等局限性,因此选择了经ACO改

用户评论

请输入评论内容

评分：

暂无评论