基于网格的DBSCAN:索引和推断

wxt12084 16 0 PDF 2021-04-06 15:04:14

DBSCAN是一种聚类算法,它可以报告任意形状的聚类和噪声,而无需将聚类的数量作为参数(例如,与其他聚类算法k -means不同)。由于DBSCAN的运行时间具有二次增长顺序,即O(n 2),因此几十年来,有关提高其性能的研究受到了相当多的关注。基于网格的DBSCAN是一种完善的算法,其复杂度在2D空间中提高到O(n log n),而在维数≥3时则需要(n 4/3)来求解。但是,我们发现基于网格的DBSCAN存在两个问题:邻居爆炸和合并中的冗余,这使算法在高维空间中不可行。在本文中,我们首先提出了一种称为GDCF的新颖算法,该算法利用位图索引来支持有效的邻居网格查询。其次,基于联合查找算法的概念,我们设计了一个类似于簇的森林结构,以减轻合并中的冗余。此外,我们发现以不同顺序运行集群林可能会导致在合并步骤中执行不同数量的合并操作。我们建议以统一的随机顺序执行合并步骤,以优化合并操作的数量。但是,对于高密度数据库,可能会出现瓶颈,我们进一步提出了以低密度优先的顺序来缓解该瓶颈。在真实数据集和合成数据集上进行的实验表明,该算法优于最新的精确/近似DBSCAN,并具有良好的可

用户评论

暂无评论

索引和视图

Ø 索引 1、什么是索引索引就是数据表中数据和相应的存储位置的列表，利用索引可以提高在表或视图中的查找数据的速度。 2、索引分类数据库中索引主要分为两类：聚集索引和非聚集索引。SQL Serv

63 2018-12-28
基于倒排索引的小型文档搜索引擎

基于倒排索引的小型文档搜索引擎，用C/C++实现

29 2019-05-01
统计推断答案

Roger.L.Berger的中文叫统计推断第二版,英文版的答案

55 2020-05-30
统计推断statisticalinference

经典的统计书籍，适合数学、机器学习、模式识别的研究人员阅读

48 2019-04-27
统计推断源码

统计推断

12 2021-02-24
基于IBM的Eclipse网格开发教程

一个关于IBM 的网格教程,外加学习心得

9 2020-10-27
基于GAMBIT的网格生成技术浅析

基于GAMBIT的网格生成技术浅析，梁荣亮，过学迅，Gambit是面向流体仿真计算软件的前处理器，具有建模与强大的网格划分功能，能够根据不同的物理模型来选择合适的网格，使网格更好地

27 2020-05-15
基于Hadoop的海量网格数据建模

针对网格实验的实际需要和现有网格仿真工具存在的不足，提出了一种结合Hadoop技术进行海量网格数据建模的方法。利用提出的建模方法，研究人员可以从海量数据中挖掘出实验所需核心数据，并建立这些数据所满足的

25 2019-09-09
基于网格的电信CRM数据挖掘

Grid-based telecom CRM data mining

23 2019-06-28
基于局域网的网格实现

基于局域网的网格实现，详细介绍了局域网中网格技术的应用突破

14 2020-01-12

基于网格的DBSCAN:索引和推断

用户评论

推荐下载