用于数据流演进的超椭球聚类技术
数据挖掘已成为建立智能决策支持系统的关键要素。 作为数据挖掘的主要分支之一,数据流群集在过去十年中受到了很多关注。 大多数现有的数据流聚类技术都依靠欧几里德距离度量来查找相似的对象,因此会产生不总是适合于表示数据的球形聚类。 此外,在大多数现实世界中的问题中,我们遇到了密度变化的数据,这些数据无法通过基于密度的聚类技术来处理。 在本文中,我们基于最近提出的HyCARCE算法,介绍了一种新的聚类技术,称为用于演进数据流的超椭球聚类(HECES)。 在HECES中,对HyCARCE算法进行了一些修改,以处理流聚类问题:使用滑动窗口模型处理传入的数据流,以最大程度地减少过时信息对最近聚类结果的影响; 在寻找相关数据的协方差时,采用收缩技术来避免奇异性问题。 一种用于合并初始椭球体的新颖技术可用于获取最终簇,而不是用于扩展和调整的计算密集型过程。 HECES依靠Mahalanobis距离度量来对数据点进行聚类,因此会形成椭圆形的聚类。 它可以成功处理各种密度的数据。 针对流数据进行聚类的各种综合和真实数据集上的实验提供了我们方法的比较验证。
用户评论
推荐下载
-
教你怎么画数据流图_包括数据流图实例.ppt
教你怎么画数据流图_包括数据流图实例.ppt
33 2019-05-06 -
数据流概要与数据流分析若干关键问题研究
数据流概要与数据流分析若干关键问题研究 阐述数据流及典型相关分析概要
29 2019-01-05 -
用于聚类算法测试的数据集.rar
两两条弧线(粗),两条弧线,两坨散点,螺旋点云(不平衡型)..等,可用于测试聚类算法两条弧线(粗),两条弧线,两坨散点,螺旋点云(不平衡型)..等,可用于测试聚类算法条弧线(粗),两条弧线,两坨散点,
40 2020-11-05 -
管道用于数据流的实验性编程语言源码
管道是用于编写大规模并行管道的语言和运行时。 与其他用于定义数据流的语言不同,管道语言要求使用Python脚本语言单独定义组件的实现。 这允许将实现的细节与管道的结构分开,同时提供对数千个活动库的访问
16 2021-02-01 -
数据流和控制流测试比较
有关软件测试的几种测试的比较,包括数据流和控制流,
20 2019-07-15 -
论文数据流分析的关键技术研究
论文《数据流分析的关键技术研究》
28 2019-05-22 -
实现手机信令数据流处理的技术框架
一种基于Spark的手机信令数据处理技术框架
13 2019-07-08 -
应用于大型数据库的聚类技术研究
应用于大型数据库的聚类技术研究
25 2019-05-05 -
Osric项目答案数据流图类图协作图
Osric学期项目自选项目类图数据流程图顺序图系统结构图PDL写法软件工程课后答案
24 2019-07-19 -
论文研究一种基于质量估算的空间数据流聚类算法研究.pdf
针对传统的基于网格密度的数据流聚类方法丢失数据的空间位置特性的缺陷,提出了一种基于质量估算(mass estimation)的空间数据流聚类方法。通过h:d树进行空间划分,可将到达数据映射到不同的划分
9 2020-07-16
暂无评论