数据中不确定性的存在使对其聚类分析时要充分考虑不确定性的影响。针对现有不确定数据聚类算法中构建不确定数据模型以及距离度量时存在的影响结果准确性与聚类性能等问题,提出一种基于快速高斯变换的不确定数据聚类算法。首先在不假设数据分布的前提下,构建符合不确定性分布特征的数据模型;然后结合不确定对象的2个重要特征:属性特征与表示不确定数据分布特征的概率密度函数,度量不确定数据对象间的相似性;并以此为基础提出不确定数据聚类算法;最后在UCI以及真实数据集上的实验结果表明,所提算法在运行效率和聚类准确性方面均能取得较好效果。
暂无评论