数据挖掘聚类算法的分析和应用研究
研究生毕业论文DBSCAN就是一种基于密度的方法,该算法的显著优点是速度快,可以发现任意形状的聚类和噪声点。但是当数据量非常庞大时,该算法对主存要求较高;而且需要定义一个全局变量Eps,如果这个全局变量Eps定义的不好,将会影响聚类质量,尤其是数据分布不均匀时,因此DBSCAN对输入参数Eps是十分依赖的。论文在分析这些不足的基础上,对DBSCAN算法进行了改进,把“分而治之”的思想应用到该算法中。聚类前,先把数据划分成一个个网格,然后把网格分配给多个处理机进行并行聚类,最后再对各个处理机的局部聚类结果进行合并。这样,一方面降低了对主存的要求;另一方面,当数据分布不均匀时,全局变量Eps也不会影响聚类质量,因为每个网格采用单独的Eps值;并且
推荐下载
-
层次聚类算法的研究
层次聚类算法的研究VC++编写数据挖掘
15 2020-05-15 -
uci数据集数据挖掘聚类.rar
uci数据集、UCI数据集、数据挖掘、聚类、机器学习、数据集、uci、uci数据集、人工智能
30 2020-03-05 -
数据挖掘中几种划分聚类算法的比较及改进
本文首先是阐述了聚类分析以及主成分分析的一些理论基础,分析和比较了几类较流行的划分聚类算法。
22 2020-06-14 -
基于MST聚类的空间数据离群挖掘算法
空间离群是指空间邻域中属性特征值明显不同于其他对象的空间对象,空间数据离群挖掘能为人们提供很多有趣的信息,但空间数据具有复杂的拓扑关系、方位关系和度量关系等空间特征,传统的面向事务型数据库的离群挖掘算
8 2021-02-27 -
聚类数据挖掘伪代码例子
DIANA算法例子第1步,找到具有最大直径的簇,对簇中的每个点计算平均相异度(假定采用是欧式距离)。1的平均距离:(1+1+1.414+3.6+4.24+4.47+5)/7=2.96类似地,2的平均距
34 2019-05-28 -
数据挖掘概念技术聚类.ppt
数据挖掘概念、技术--关联4.ppt 共6个文档,这个是第4个ppt文档
8 2021-02-23 -
基于数据仓库与数据挖掘的航空货运分析CRM应用研究
基于数据仓库与数据挖掘的航空货运分析CRM应用研究,了解数仓建设,以及建立在数仓之上的应用
21 2019-03-14 -
spark聚类算法的数据
spark运行聚类算法的数据集,分为train和test的数据格式,scv格式
24 2019-05-06 -
关联规则挖掘Apriori算法的改进及其应用研究
关联规则挖掘Apriori算法的改进及其应用研究,对初学这块知识的人有很大的帮助。
31 2018-12-20 -
基于决策树算法的石油基础数据挖掘系统应用研究
针对石油基础数据量急剧增长,数据之间不能达成共享,管理不能保持统一等问题,研究并设计了石油基础数据挖掘系统分析系统。通过构建石油基础数据数据仓库模型,用于完成数据清理、数据变换和数据集成等数据预处理操
14 2021-01-31
用户评论