通过离群指标增强离群值检测
离群检测是数据挖掘中的一项重要任务,在天文观测,文本检测,欺诈检测等众多应用中具有很高的实用价值。 当前,有许多流行的异常检测算法可用,包括基于分布的,基于距离的,基于密度的和基于聚类的方法等。 然而,传统的离群值检测算法面临一些挑战。 举例来说,大多数基于距离和基于密度的离群值检测方法都是基于k最近邻,因此对k值非常敏感。 再例如,某些方法只能检测全局离群值,而不能检测局部离群值。 最后但并非最不重要的一点是,大多数离群值检测算法无法准确地区分边界点和离群值。 为了部分解决这些问题,在本文中,我们建议在经典离群值检测算法中增加一些边界指标。 在合成数据集和真实数据集上进行的实验都证明了增强的异常值检测算法的有效性。
暂无评论